WO2022174436A1

WO2022174436A1 - 分类模型增量学习实现方法、装置、电子设备及介质

Info

Publication number: WO2022174436A1
Application number: PCT/CN2021/077147
Authority: WO
Inventors: 何玉林; 黄启航
Original assignee: 深圳大学
Priority date: 2021-02-22
Filing date: 2021-02-22
Publication date: 2022-08-25

Abstract

一种分类模型增量学习实现方法、装置、电子设备及介质。所述方法包括：获取至少一个无标签增量样本（S110）；将无标签增量样本逐个输入到建立的分类模型进行类别预测；所述分类模型至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到（S120）；依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，以实现分类模型的训练更新（S130）。

Description

分类模型增量学习实现方法、装置、电子设备及介质

技术领域

本申请涉及计算机技术领域，例如涉及一种分类模型增量学习实现方法、装置、电子设备及介质。

背景技术

半监督学习作为有监督学习和无监督学习的结合体，其利用有限的有标签样本和大量无标签样本进行建模和学习。半监督学习方法的一般步骤是利用有标签数据初步建立模型，再根据无标签数据的分布特点来训练和优化模型，从而达到提升模型精度的效果。但是，在有新的无标签样本提供时，分类模型必须重新训练，而很难在已有分类模型基础上增量学习或是学习成本较高。因此如何在半监督情况下对分类模型进行增量学习变得尤为重要。

发明内容

本申请提供了一种分类模型增量学习实现方法、装置、电子设备及介质，以实现能够根据大量的无标签样本进行增量学习提高模型预测精度。

第一方面，本申请实施例中提供了一种分类模型增量学习实现方法，所述方法包括：

获取至少一个无标签增量样本；

将无标签增量样本逐个输入到建立的分类模型进行类别预测；所述分类模型至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到；

依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，以实现分类模型的训练更新。

第二方面，本申请实施例中还提供了一种分类模型增量学习实现装置，所述装置包括：

样本获取模块，用于获取至少一个无标签增量样本；

样本预测模块，用于将无标签增量样本逐个输入到建立的分类模型进行类别预测；所述分类模型至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到；

增量学习模块，用于依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，以实现分类模型的训练更新。

第三方面，本申请实施例中还提供了一种电子设备，包括：

一个或多个处理装置；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理装置执行，使得所述一个或多个处理装置实现如本申请实施例中提供的所述分类模型增量学习实现方法。

第四方面，本申请实施例中还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理装置执行时实现如本申请任意实施例中提供的所述分类模型增量学习实现方法。

本申请实施例中提供了一种分类模型增量学习实现方法，可至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到分类模型，并使用预先建立的分类模型逐个对无标签增量样本进行类别预测，进而基于对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习更新。采用本申请方案，在分类模型训练完成后，如果有新的数据样本提供时，通过使用分类模型对无标签增量样本进行类别预测来扩充增量学习所需的带标签增量样本，解决了在对分类模型进行更新时必须重新训练无法在模型基础上增量学习的缺陷，实现有标签数据的标签不完整的情况下仍旧根据大量的无标签数据进行增量运算提高模型预测精度的效果，并使得模型复杂度始终同数据样本复杂度保持在类似水平，降低模型学习成本和复杂度。

附图说明

图1是本申请实施例中提供的一种分类模型增量学习实现方法的流程图；

图2是本申请实施例中提供的另一种分类模型增量学习实现方法的流程图；

图3是本申请实施例中提供的一种分类模型增量学习的运算过程图；

图4是本申请实施例中提供的一种样本数据集信息的示意图；

图5a是本申请实施例中提供的一种样本数据集下增强学习对比示意图；

图5b是本申请实施例中提供的另一种样本数据集下增强学习对比示意图；

图5c是本申请实施例中提供的又一种样本数据集下增强学习对比示意图；

图6是本申请实施例中提供的一种分类模型增量学习实现装置的结构框图；

图7是本申请实施例中提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前，应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作(或步骤)可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

下面针对本申请中提供的分类模型增量学习实现方法、装置、电子设备及存储介质，通过以下各个实施例及其可选方案进行详细阐述。

图1是本申请实施例中提供的一种分类模型增量学习实现方法的流程图。本申请实施例可适用于对类别识别模型进行增量学习的情况。该方法可由分类模型增量学习实现装置来执行，该装置可以采用软件和/或硬件的方式实现，并集成在任何具有网络通信功能的电子设备上。如图1所示，本申请实施例中提供的分类模型增量学习实现方法，可包括以下步骤：

S110、获取至少一个无标签增量样本。

样本类别标签可以用于表示样本对象的类别信息，在对分类模型进行模型训练与更新时，数据样本集具体可包括三部分：有样本类别标签但样本类别标签不完整的初始样本数据集D ₁、无样本类别标签但样本实际上涵盖所有类别的无标签增量样本数据集D ₂以及样本类别标签完整的验证样本数据集D ₃。

为了便于阐述分类模型增量学习实现方案，设定一个有五个样本属性和四个样本类别的样本数据集来实现分类模型的训练与更新操作，其中样本属性可分别记作A ₁,A ₂,A ₃,A ₄,A ₅，样本的类别可分别记作C ₁,C ₂,C ₃,C ₄。

S120、将无标签增量样本逐个输入到建立的分类模型进行类别预测；分类模型至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到。

在给定具有部分类别标签但类别标签不完整的初始样本数据集D ₁后，由于初始样本数据集D ₁的部分样本类别标签是已知的，因此可预先利用已知部分样本标签的初始样本数据使用极限学习机进行数据建模得到一个极限学习机模型。

可选地，极限学习机是一个包含单输入层、单隐含层和单输出层的神经网络，给定初始样本数据集D ₁数据规模后，可获知输入层和输出层的节点数，而隐含层节点可通过经验和尝试来分配，例如选取数据规模的

左右。

可选地，分类模型的参数计算过程可为：

其中，W和B分别为输入权重和偏置，是每个值随机初始化在[-1,1]之间的矩阵，σ是Sigmoid激活函数，公式为

将极限学习机输入记作X，输出记作Y，基于初始样本数据集D ₁使用极限学习机进行数据建模得到一个分类模型。

当有新的无标签增量样本过来，将无标签增量样本逐次投入到分类模型中进行类别预测，得到对无标签增量样本的类别预测结果。其中，分类模型输出的类别预测结果Y是经过独热编码转换的矩阵。例如，使用极限学习机建立分类模型后，能够对新的数据进行预测。给定新的至少一个无标签增量样本x，分类模型可逐个预测输入的无标签增量样本返回预测结果

S130、依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，以实现分类模型的训练更新。

根据本实施例中提供的分类模型增量学习实现方法，在分类模型训练完成后，如果有新的数据样本提供时，通过使用分类模型对无标签增量样本进行类别预测来扩充增量学习所需的带标签增量样本，解决了在对分类模型进行更新时必须重新训练无法在模型基础上增量学习的缺陷，实现有标签数据的标签不完整的情况下仍旧根据大量的无标签数据进行增量运算提高模型预测精度的效果，在标签不完整的情况下仍旧保持良好的学习精度使得算法具有良好的可学习性，同时给定有新的样本数据时能够较快地对模型进行更新，且让模型复杂度始终同样本数据复杂度保持在类似水平，降低模型学习成本和复杂度。

图2是本申请实施例中提供的另一种分类模型增量学习实现方法的流程图，本申请实施例在上述实施例的基础上对前述实施例进行说明，本申请实施例可以与上述一个或者多个实施例中各个可选方案结合。如图2所示，本申请实施例中提供的分类模型增量学习实现方法，可包括以下步骤：

S210、获取至少一个无标签增量样本。

S220、将无标签增量样本逐个输入到建立的分类模型进行类别预测；分类模型至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到。

S230、确定各个对无标签增量样本的类别预测结果是否准确。

参见图3，初始样本可用于分类模型的初步训练，增量样本可用于对已建立的分类模型的增量学习(如果无标签则在半监督学习中无法使用)。对于每个无标签增量样本而言，均可通过分类模型得到一个类别预测结果，但并不是所有类别预测结果都应被接受，即会存在一些预测不准确的结果，因此需要对得到的类别预测结果准确度做进一步筛选，分离出可能存在预测异常的类别预测结果。进而，对于一组新的确定要增量学习更新的样本数据S＝(X _C,Y _C)，根据类别预测结果Y _C的预测准确度，可针对分了模型做不同的更新操作。

在本实施例的一种可选方案中，参见图3，依据对无标签增量样本的类别预测结果与对应无标签增量样本对建立的分类模型进行增量学习，可包括以下：

若确定对无标签增量样本的类别预测结果准确，则无标签增量样本与对无标签增量样本的类别预测结果组成一个有标签增量样本，并基于组成的有标签增量样本对建立的分类模型进行增量学习。

分类模型的输出Y是一个经过独热编码后的矩阵。一个无标签增量样本在输入到分类模型后输出的类别预测结果也服从类似的规律。例如，假如对无标签增量样本的类别预测结果为

通常取矩阵中最大元素值作为预测的真实结果，将该位置为1，其他位置为0，从而得到

基于对无标签增量样本的类别预测结果输出的矩阵中各个元素值的取值大小即可获知对无标签增量样本的类别预测结果是否准确。如果确定对无标签增量样本的类别预测结果准确，表明通过类别预测结果可获知无标签增量样本的样本类别，此时则可将该无标签增量样本及其类别预测结果组成一个有标签数据投入到分类模型中进行常规的增量学习从而提升模型的预测精度。

示例性地，如果对无标签增量样本的类别预测结果Y _C是准确地，通常这个类别预测结果Y _C是分类模型已知的一个类别，分类模型可以利用组成的多个有标签增量样本对分类模型进行常规增量学习操作，在对分类模型进行常规增量更新后，

其中W _C和B _C同W和B的生成方法类似。

在本实施例的一种可选方案中，依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，还包括以下操作：

基于对无标签增量样本的类别预测结果对应矩阵中最大元素取值相对预设阈值的偏离程度，确定对无标签增量样本的类别预测结果是否准确。

分类模型输出的类别预测结果是经过独热编码转换的矩阵，一个样本的模型预测结果也服从类似的规律。但是，由分析可知，若对无标签增量样本的类别预测结果对应矩阵值最大元素值大幅偏离预设阈值(预设阈值可为1)，那么该对无标签增量样本的类别预测结果是不准确的，即从该对无标签增量样本的类别预测结果无法准确获知样本的类别。例如，对于类别预测结果

或者

两个对无标签增量样本的类别预测结果对应矩阵中的最大元素值分别为0.5和1.4，都明显偏离理论最优值1，那么这两个对无标签增量样本的类别预测结果很大可能就是不准确的。

可选地，通过分析可知，当最大元素取值相对预设阈值的偏离量为±0.05以内时，对无标签增量样本的类别预测结果是能够被接受的，即对无标签增量样本的类别预测结果对应矩阵中最大元素值在[0.95,1.05]之间时，认为该无标签增量样本的类别预测结果是准确的，否则，认为预测结果不准确。这样，当无标签增量样本的类别预测结果准确时，可将准确的无标签增量样本以及对样本的类别预测结果进行组合按照常规增量学习方式进行模型更新。

S240、若确定对无标签增量样本的类别预测结果不准确，则对预测不准确的无标签增量样本进行存储。

参见图3，如果对无标签增量样本的类别预测结果不准确，可认为分类模型判断预测该样本数据的类别预测很可能与已知类别标签都不相同，属于一个新的类别标签或是一个异常数据，此时则可将该无标签增量样本数据移入一个待定集合中进行存储，这里可称为异常集合S _ab。

S250、在存储的无标签增量样本达到预设数据量时，对存储的无标签增量样本集进行新类标签识别得到新类标签。

参见图3，当异常集合S _ab＝{x ₁,x ₂,...,x _p}中存储的无标签增量样本的数据量p达到一个指定阈值时，有理由相信异常集合中包含分类模型无法识别新类别的无标签增量样本。此时，可对存储的无标签增量样本集进行新类标签识别得到无标签增量样本中隐藏的新类别，以构建无标签增量样本的新类标签。

在本实施例的一种可选方案中，参见图3，对存储的无标签增量样本集进行新类标签识别得到新类标签，可包括以下步骤A1-A3：

步骤A1、对存储的无标签增量样本集进行新类挖掘，筛选得到密度最大且簇大小大于预设值的一个新类簇。

针对异常集合中无标签增量样本集，可以使用基于密度的新簇挖掘算法对存储的无标签增量样本集进行新类簇的挖掘，找到在一定数量限制条件下密度最大的一个簇，这个新类簇的数据被认为都是属于同一个新的类别标签。在使用基于密度的新簇挖掘算法进行新类簇挖掘时，对异常集合中无标签增量样本进行距离假设，即假设距离越近的样本其标签越可能相同。

可选地，给定最小簇大小ms(ms＜p)，距离增量Δd，基于密度的新簇挖掘算法返回密度最大且数量大于ms的一个新类簇c，具体过程描述如下：

(1)输入：S _ab,ms,Δd，输出：簇c；(2)将异常集合中包括的每一个无标签增量样本看作一个簇，从而有{x ₁},{x ₂},...,{x _p}；(3)求出无标签增量样本之间的最小距离d；(4)将距离小于或等于d且不属于同一个簇的一组无标签增量样本所在的簇合并为一个簇，如果找不到这样的一组样本，则令d＝d+Δd，并再次执行本操作，直到找到为止；(5)判断合并后的簇的大小是否超过ms，如果没有超过，跳转到操作(4)，如果超过，则返回该簇，结束算法。

可选地，当d增大到样本间最大距离时，此时所有的无标签增量样本会被划分到同一个簇中，该簇的大小将超过给定的条件，从而达到终止条件。该基于密度的聚类方法可以在发现第一个满足条件的簇时，会停止搜索过程，且该搜索过程是贪心过程，从而能尽可能保证簇的质量以及搜寻速度。

步骤A2、将标签类别完整的验证样本逐个输入到建立的分类模型进行类别预测。

步骤A3、依据对验证样本的类别预测结果与新类簇的取值，识别新类簇所属的真实标签类别，并作为存储的无标签增量样本的新类标签。

挖掘出的新类簇要同样本所属真实的类别标签作对应，以样本的类别分别为C ₁,C ₂,C ₃,C ₄为例，这里假定初始样本数据集D ₁中有的标签为C ₁和C ₂，基于初始样本数据集D ₁建立的分类模型最初通常只能识别C ₁和C ₂；即建立的分类模型通常无法分辨新类簇究竟是C ₃还是C ₄，在此可先将获取的新类簇暂记作T ₁，进而找到T ₁同真实类别标签的对应关系，即T ₁＝C ₃或T ₁＝C ₄。

参见图3，可将标签完整的验证样本数据集逐个带入分类模型所得的预测结果记作YV'，而其真实结果记作YV。在YV'中有一些结果是新类标签，统计这些新标签的数据的真实标签中哪种未知类别占比最多，则从统计学角度来看该未知的真实标签就最有可能同模型的新类对应。如果找不到可对应的未知标签，则说明该“新类”是已知的某种类别而不是新类，将这部分数据按照已知类别数据处理。具体算法流程描述如下：

(1)输入：验证样本数据集{XV,YV},T ₁；输出：T ₁的真实类别C；(2)将验证集输入XV放入模型中得预测结果YV'；(3)将YV'中所有值为T ₁的位置记录于Pos；(4)抽取YV中位置在Pos的所有值，记录于Val；(5)统计Val中各标签值出现的频次，并取其中最高的且不是模型已知的类别为C；(6)如果找到这样的C，则返回C，否则返回None，表示找不到对应的真实类别。

S260、将识别得到的新类标签与存储的无标签增量样本组成具有新类标签的增量样本，对建立的分类模型进行增量学习，以实现分类模型的训练更新。

参见图3，在对无标签增量样本的类别预测结果不准确的情况下，对无标签增量样本的类别预测结果Y _C是分类模型未知的一个类别，通过识别无标签增量样本中隐藏的新类簇并进行新类识别，尝试将这一组有相同新标签的样本进行标签增量更新。在进行新类标签增量之后，可将识别得到的新类标签与对应存储的无标签增量样本组成具有新类标签的增量样本，对建立的分类模型进行增量学习。增量学习后，

其中W _C和B _C同W和B的生成方法类似，

其中λ∈(0,1]为置信因子，该值越接近1，表明对数据属于新类的确信程度越高。当为1时，Y _C'的值全为0。这样设定的好处在于信息的损失会有所减少。图4示出了样本数据集信息的示意图，图5a、图5b以及图5c分别示出了在不同样本数据集下的增强学习算法对比示意图。

根据本实施例中提供的分类模型增量学习实现方法，在分类模型训练完成后，如果有新的数据样本提供时，通过使用分类模型对无标签增量样本进行类别预测来扩充增量学习所需的带标签增量样本，解决了在对分类模型进行更新时必须重新训练无法在模型基础上增量学习的缺陷，实现有标签数据的标签不完整的情况下仍旧根据大量的无标签数据进行增量运算提高模型预测精度的效果，在标签不完整的情况下仍旧保持良好的学习精度使得算法具有良好的可学习性，同时给定有新的样本数据时能够较快地对模型进行更新，且让模型复杂度始终同样本数据复杂度保持在类似水平，降低模型学习复杂度。同时，在无标签数据的真实标签不属于已知标签中任何一个时，能够大致判断数据的预测是否异常，并能够对异常数据进行新类挖掘，与一般半监督增强学习相比，本实施例中基于极限学习机的半监督增量学习对初始数据标签缺省的情况具备新类挖掘能力，实现根据大量的无标签数据进行增量运算提高模型预测精度，相比于其他算法，应用场合更加广泛。

在上述实施例的基础上，可选地，由于在每次增量计算过程中都需要对一个矩阵做求逆运算，当矩阵的规模不断变大时，求逆运算的开销将会变得越来越大。考虑到该过程是增量计算过程，因此可以考虑重复利用一部分已有的计算过程，从而可以节省大量的计算。

给定矩阵A及其伪逆矩阵

其行增量矩阵[A A _C]的伪逆结果为

其中

C＝A _C-AD。类似的，其列增量矩阵

的伪逆结果为

其中

C＝A _C-D ^TA。将以上计算过程带入分类模型的增量过程中，可得迭代公式：

如果对无标签增量样本的类别预测结果Y _C是分类模型已知的一个类别，则

其中A＝σ(WX+B)，A _C＝σ(W _CX _C+B _C)，

C＝A _C-AD。如果对无标签增量样本的类别预测结果 Y _C不是分类模型已知的一个类别，则

其中A＝σ(WX+B)，A _C＝σ(W _CX _C+B _C)，

C＝A _C-AD。

图6是本申请实施例中提供的一种分类模型增量学习实现装置的结构框图。本申请实施例可适用于对类别识别模型进行增量学习的情况。该装置可以采用软件和/或硬件的方式实现，并集成在任何具有网络通信功能的电子设备上。

如图6所示，本申请实施例中提供的分类模型增量学习实现装置，可包括以下步骤：样本获取模块610、样本预测模块620和增量学习模块630。其中：

样本获取模块610，用于获取至少一个无标签增量样本；

样本预测模块620，用于将无标签增量样本逐个输入到建立的分类模型进行类别预测；所述分类模型至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到；

增量学习模块630，用于依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，以实现分类模型的训练更新。

在上述实施例的基础上，可选地，增量学习模块630包括：

若确定所述对无标签增量样本的类别预测结果准确，则无标签增量样本与对无标签增量样本的类别预测结果组成一个有标签增量样本，并基于组成的有标签增量样本对建立的分类模型进行增量学习。

在上述实施例的基础上，可选地，增量学习模块630包括：

若确定所述对无标签增量样本的类别预测结果不准确，则对预测不准确的无标签增量样本进行存储；

在存储的无标签增量样本达到预设数据量时，对存储的无标签增量样本集进行新类标签识别得到新类标签；

将识别得到的新类标签与存储的无标签增量样本组成具有新类标签的增量样本，对建立的分类模型进行增量学习。

在上述实施例的基础上，可选地，对存储的无标签增量样本集进行新类标签识别得到新类标签，包括：

对存储的无标签增量样本集进行新类挖掘，筛选得到密度最大且簇大小大于预设值的一个新类簇；

将标签类别完整的验证样本逐个输入到建立的分类模型进行类别预测；

依据对验证样本的类别预测结果与新类簇的取值，识别所述新类簇所属的真实标签类别，并作为存储的无标签增量样本的新类标签。

在上述实施例的基础上，可选地，所述分类模型输出的类别预测结果是经过独热编码转换的矩阵；增量学习模块630还包括：

基于所述对无标签增量样本的类别预测结果对应矩阵中最大元素取值相对预设阈值的偏离程度，确定对无标签增量样本的类别预测结果是否准确。

本申请实施例中所提供的分类模型增量学习实现装置可执行上述本申请任意实施例中所提供的分类模型增量学习实现方法，具备执行该分类模型增量学习实现方法相应的功能和效果，详细过程参见前述实施例中分类模型增量学习实现方法的相关操作。

图7是本申请实施例中提供的一种电子设备的结构示意图。如图7所示结构，本申请实施例中提供的电子设备包括：一个或多个处理器710和存储装置720；该电子设备中的处理器710可以是一个或多个，图7中以一个处理器710为例；存储装置720用于存储一个或多个程序；所述一个或多个程序被所述一个或多个处理器710执行，使得所述一个或多个处理器710实现如本申请实施例中任一项所述的分类模型增量学习实现方法。

该电子设备还可以包括：输入装置730和输出装置740。

该电子设备中的处理器710、存储装置720、输入装置730和输出装置740可以通过总线或其他方式连接，图7中以通过总线连接为例。

该电子设备中的存储装置720作为一种计算机可读存储介质，可用于存储一个或多个程序，所述程序可以是软件程序、计算机可执行程序以及模块，如本申请实施例中所提供的分类模型增量学习实现方法对应的程序指令/模块。处理器710通过运行存储在存储装置720中的软件程序、指令以及模块，从而执行电子设备的各种功能应用以及数据处理，即实现上述方法实施例中分类模型增量学习实现方法。

存储装置720可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储装置720可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置720可进一步包括相对于处理器710远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置730可用于接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏等显示设备。

并且，当上述电子设备所包括一个或者多个程序被所述一个或者多个处理器710执行时，程序进行如下操作：

获取至少一个无标签增量样本；

当然，本领域技术人员可以理解，当上述电子设备所包括一个或者多个程序被所述一个或者多个处理器710执行时，程序还可以进行本申请任意实施例中所提供的分类模型增量学习实现方法中的相关操作。

本申请实施例中提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时用于执行分类模型增量学习实现方法，该方法包括：

获取至少一个无标签增量样本；

可选的，该程序被处理器执行时还可以用于执行本申请任意实施例中所提供的分类模型增量学习实现方法。

本申请实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory，RAM)、只读存储器(Read Only Memory，ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于：电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、无线电频率(RadioFrequency，RF)等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

Claims

一种分类模型增量学习实现方法，包括：

获取至少一个无标签增量样本；

将无标签增量样本逐个输入到建立的分类模型进行类别预测；所述分类模型至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到；

依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，以实现分类模型的训练更新。
根据权利要求1所述的方法，其中，依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，包括：

若确定所述对无标签增量样本的类别预测结果准确，则无标签增量样本与对无标签增量样本的类别预测结果组成一个有标签增量样本，并基于组成的有标签增量样本对建立的分类模型进行增量学习。
根据权利要求1所述的方法，其中，依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，包括：

若确定所述对无标签增量样本的类别预测结果不准确，则对预测不准确的无标签增量样本进行存储；

在存储的无标签增量样本达到预设数据量时，对存储的无标签增量样本集进行新类标签识别得到新类标签；

将识别得到的新类标签与存储的无标签增量样本组成具有新类标签的增量样本，对建立的分类模型进行增量学习。
根据权利要求3所述的方法，其中，对存储的无标签增量样本集进行新类标签识别得到新类标签，包括：

对存储的无标签增量样本集进行新类挖掘，筛选得到密度最大且簇大小大于预设值的一个新类簇；

将标签类别完整的验证样本逐个输入到建立的分类模型进行类别预测；

依据对验证样本的类别预测结果与新类簇的取值，识别所述新类簇所属的真实标签类别，并作为存储的无标签增量样本的新类标签。
根据权利要求1所述的方法，其中，所述分类模型输出的类别预测结果是经过独热编码转换的矩阵；

相应地，依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，还包括：

基于所述对无标签增量样本的类别预测结果对应矩阵中最大元素取值相对预设阈值的偏离程度，确定对无标签增量样本的类别预测结果是否准确。
一种分类模型增量学习实现装置，包括：

样本获取模块，用于获取至少一个无标签增量样本；

样本预测模块，用于将无标签增量样本逐个输入到建立的分类模型进行类别预测；所述分类模型至少部分采用有标签且标签不完整的初始样本使用极限学习机建模得到；

增量学习模块，用于依据对无标签增量样本的类别预测结果与对应无标签增量样本，对建立的分类模型进行增量学习，以实现分类模型的训练更新。
根据权利要求6所述的装置，其中，增量学习模块包括：

若确定所述对无标签增量样本的类别预测结果准确，则无标签增量样本与对无标签增量样本的类别预测结果组成一个有标签增量样本，并基于组成的有标签增量样本对建立的分类模型进行增量学习。
根据权利要求6所述的装置，其中，增量学习模块包括：

若确定所述对无标签增量样本的类别预测结果不准确，则对预测不准确的无标签增量样本进行存储；

在存储的无标签增量样本达到预设数据量时，对存储的无标签增量样本集进行新类标签识别得到新类标签；

将识别得到的新类标签与存储的无标签增量样本组成具有新类标签的增量样本，对建立的分类模型进行增量学习。
根据权利要求8所述的装置，其中，对存储的无标签增量样本集进行新类标签识别得到新类标签，包括：

对存储的无标签增量样本集进行新类挖掘，筛选得到密度最大且簇大小大于预设值的一个新类簇；

将标签类别完整的验证样本逐个输入到建立的分类模型进行类别预测；

依据对验证样本的类别预测结果与新类簇的取值，识别所述新类簇所属的真实标签类别，并作为存储的无标签增量样本的新类标签。
根据权利要求6所述的装置，其中，所述分类模型输出的类别预测结果是经过独热编码转换的矩阵；增量学习模块还包括：

基于所述对无标签增量样本的类别预测结果对应矩阵中最大元素取值相对预设阈值的偏离程度，确定对无标签增量样本的类别预测结果是否准确。
一种电子设备，包括：

一个或多个处理装置；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理装置执行，使得所述一个或多个处理装置实现权利要求1-5中任一项所述的分类模型增量学习实现方法。
一种计算机可读介质，存储有计算机程序，该程序被处理装置执行时实现权利要求1-5中任一项所述的分类模型增量学习实现方法。