CN115438755A - 分类模型的增量训练方法、装置和计算机设备 - Google Patents
分类模型的增量训练方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN115438755A CN115438755A CN202211388547.4A CN202211388547A CN115438755A CN 115438755 A CN115438755 A CN 115438755A CN 202211388547 A CN202211388547 A CN 202211388547A CN 115438755 A CN115438755 A CN 115438755A
- Authority
- CN
- China
- Prior art keywords
- sample
- target
- fictitious
- category
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 241
- 238000012549 training Methods 0.000 title claims abstract description 158
- 238000000034 method Methods 0.000 title claims abstract description 73
- 239000013598 vector Substances 0.000 claims abstract description 173
- 230000006870 function Effects 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 11
- 238000009826 distribution Methods 0.000 description 20
- 239000000284 extract Substances 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 239000007787 solid Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000004547 Hallucinations Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000634708 Modelia Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- RYYVLZVUVIJVGH-UHFFFAOYSA-N trimethylxanthine Natural products CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种分类模型的增量训练方法、装置和计算机设备。所述方法包括:获取经真实样本和虚构样本共同训练得到的目标分类模型;获取新增样本,新增样本所属的新增类别不同于任一真实类别;将新增样本输入至目标分类模型,并通过目标分类模型提取新增样本的特征向量;确定特征空间中与各个虚构类别分别对应的目标代表特征,并基于特征向量与各目标代表特征间的差异,确定与新增样本匹配的目标虚构类别;将目标虚构类别更新为新增类别,以使得目标分类模型支持对新增类别的预测。采用本方法能够在分类任务中快速支持对新增数据和新增类别的预测。
Description
技术领域
本申请涉及机器学习技术领域,特别是涉及一种分类模型的增量训练方法、装置和计算机设备。
背景技术
分类任务指的是在特征维度上将不同的数据进行区分,例如对视频的品类进行区分,以识别视频属于综艺节目、游戏视频、或者体育直播等。或者,也可以对文学作品的类型进行区分,以识别文学作品属于写实类、科幻类、或者情感类等。
在实际的业务场景中,所需要进行识别的分类会随着业务数据变化而变化,时常会遇到需要新增加一些类别的情况。然而,相关技术中所使用的分类模型,在训练完成之后只能对已有的类别进行检测,对于新增的类别无法进行相应类别的预测输出。因此,需要将已有的数据和新增的数据作为输入,重新训练一个新的分类模型,以支持对新增的类别的预测。
而随着新的类别的不断增加,每次增加一个新的类别后,都需要重新再训练一个分类模型,效率十分低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高分类任务效率的分类模型的增量训练方法、装置、计算机设备、计算机可读存储介质、以及计算机程序产品。
一方面,本申请提供了一种分类模型的增量训练方法。所述方法包括:
获取经真实样本和虚构样本共同训练得到的目标分类模型,所述目标分类模型支持对虚构类别和真实类别的预测;
获取新增样本,所述新增样本所属的新增类别不同于任一所述真实类别;
将所述新增样本输入至所述目标分类模型,并通过所述目标分类模型提取所述新增样本的特征向量;
确定特征空间中与各个虚构类别分别对应的目标代表特征,并基于所述特征向量与各目标代表特征间的差异,确定与所述新增样本匹配的目标虚构类别;
将所述目标虚构类别更新为所述新增类别,以使得所述目标分类模型支持对所述新增类别的预测。
另一方面,本申请还提供了一种分类模型的增量训练装置。所述装置包括:
模型模块,用于获取经真实样本和虚构样本共同训练得到的目标分类模型,所述目标分类模型支持对虚构类别、以及所述真实样本所属真实类别的预测;
获取模块,用于获取新增样本,所述新增样本所属的新增类别不同于任一所述真实类别;
输入模块,用于将所述新增样本输入至所述目标分类模型,并通过所述目标分类模型提取所述新增样本的特征向量;
分类模块,用于确定特征空间中与各个虚构类别分别对应的代表特征,并基于所述特征向量与各代表特征间的差异,确定与所述新增样本匹配的目标虚构类别;
更新模块,用于将所述目标虚构类别更新为所述新增类别,以使得所述目标分类模型支持对所述新增类别的预测。
另一方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述分类模型的增量训练方法的步骤。
另一方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述分类模型的增量训练方法的步骤。
另一方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述分类模型的增量训练方法的步骤。
上述分类模型的增量训练方法、装置、计算机设备、存储介质和计算机程序产品,通过真实样本和虚构样本共同训练,得到目标分类模型,并在获取了新增样本且该新增类别不属于已有的真实类别的情况下,基于训练好的目标分类模型提取特征向量,将该特征向量与经训练后得到的各个虚构类别的目标代表特征进行比较,从而基于比较得到的差异来确定该新增样本所属的目标虚构类别,由此,将该目标虚构类别更新为该新增类别,后续即可实现对该新增类别的数据的支持。通过上述方式,在增加了新的类别后,无需对原有的分类模型重新进行训练,只需要将所预留的一种虚构类别确定为新的类别即可,极大地提高了分类模型的迭代更新效率。同时,在增加新的类别后只需更新相应的虚构类别,不会改变原有的类别的分布,使得分类模型在学习新数据的同时不会影响到其对旧数据已有的支持。
附图说明
图1为一个实施例中通用分类模型的原理示意图;
图2为一个实施例中分类模型的增量训练方法的应用环境图;
图3为一个实施例中分类模型的增量训练方法的流程示意图;
图4为一个实施例中特征空间各类别的类中心的原理示意图;
图5为一个实施例中特征空间各类别所占据区域的原理示意图;
图6为一个实施例中目标分类模型的训练步骤的流程示意图;
图7A为一个实施例中确定与真实样本匹配的目标虚构类别的原理示意图;
图7B为一个实施例中确定与虚构样本匹配的目标真实类别的原理示意图;
图8为一个实施例中主干网络的架构示意图;
图9为一个实施例中分类模型的增量训练装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了便于更加清楚地理解本申请的发明构思,首先对分类模型进行介绍。通常,如图1所示,将样本数据会输入到分类模型(通常可以是卷积神经网络等架构)中进行特征提取,再将提取到的特征向量输入至分类器中,从而将特征向量映射到指定的类别,从而输出该样本数据所属的类别。分类器一般由几层全联接层(Fully Connected Layer)加上一层分类层(Softmax)来实现。
示例性地,分类器通过如下公式(1)对样本数据所属的类别进行预测:
在获得对每个类别的预测概率后,示例性地,可以通过如下公式(2)计算交叉熵损失函数(Cross-entropy Loss):
其中,M为样本数量,为第i个类别的真值。对于来说,如果该样本数据属于第i
类数据,则对应的真值为1,否则为0。从上述公式可以看出,如果真值对应的类别预测得到
的概率值越大,则损失值越小。因此,分类模型通常是训练模型以使得其对样本数据对应的
真实类进行更高概率的预测。
然而,从上述公式也可以看出,类别数K是在模型构建时预先设置好的固定值。同时,每个类别对应于何种类别也是预先设定的,无法修改。如果需要增加n个新的类别,则需要将K值修改为K+n,同时收集这n个类对应的样本数据,并重新训练分类模型。这样每次增加新的类别,都需要重新训练一遍分类模型。并且,这种方式还存在另一个问题,即当K值较大时,倘若新增的类别数量较少(即n值较小),则会导致较少的新类别的样本数据无法有效地支持新的分类模型的训练,新的分类模型对新的类别的预测不够准确。
有鉴于此,本申请实施例提供一种分类模型的增量学习方法,将增量学习(Incremental Learning)应用到分类模型的训练中,对于新增的类别,无需对分类模型重新进行训练,能够在只基于新增类别的样本数据的情况下,实现对分类模型的更新,并且同时保证分类模型对原有的样本数据的支持效果不变。由此,能够极大地提升分类模型的迭代效率,从而满足各种灵活多变的业务需求。
本申请实施例提供的分类模型的增量学习方法,具有较高的灵活度和适应能力,可以适配各种基于分类的任务中,例如视频分类、图片分类、文本分类、或者音频分类等。分类模型输出的类别还可以作为其他任务的输入,例如,经分类模型预测输出而标注的视频标签,可以用于后续内容理解、视频分发等任务。又如,对于音频数据的分类,可以用于音乐推荐任务等。
本申请实施例提供的分类模型的增量训练方法,可以应用于如图2所示的应用环境中。其中,终端202与服务器204连接以进行通信。终端202和服务器204可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。数据存储系统可以存储服务器204需要处理的数据。数据存储系统可以集成在服务器204上,也可以放在云上或其他服务器上。
通常,服务器204具有较强的处理能力,能够对大量的训练样本进行训练,上述方法可以由服务器204执行。即,服务器204获取经真实样本和虚构样本共同训练得到的目标分类模型,并将新增样本输入至该目标分类模型中,提取特征向量后确定与该新增样本匹配的目标虚构类别,再将该目标虚构类别更新为该新增类别,以使得该目标分类模型能够支持对该新增类别的预测。在终端202的硬件设备支持的情况下,上述方法也可以由终端202执行。
其中,终端202可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备、或者便携式可穿戴设备等中的一种或多种,物联网设备可为智能音箱、智能电视、智能空调、或者智能车载设备等中的一种或多种。便携式可穿戴设备可为智能手表、智能手环、或者头戴设备等中的一种或多种。
其中,服务器204可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一些实施例中,终端上可装载有APP(Application)应用程序,包括传统需要单独安装的应用程序、以及不需要下载安装即可使用的小程序应用,例如浏览器客户端、网页客户端、视频客户端等中的一种或多种。终端可以通过应用程序获取服务器传输的视频、小说、音乐等内容。在提供各种内容的同时,应用程序还可以提供各种内容下的多种分类,用户可以通过选择感兴趣的分类,来获取相应分类下的内容进行浏览、观看等。
在一个实施例中,如图3所示,提供了一种分类模型的增量训练方法,该方法可以应用于终端或服务器,也可以由终端和服务器协同执行。下面以该方法应用于计算机设备为例进行说明,该计算机设备可以是终端或服务器。该方法包括以下步骤:
步骤S302,获取经真实样本和虚构样本共同训练得到的目标分类模型,目标分类模型支持对虚构类别和真实类别的预测。
其中,本申请中在对分类模型进行训练之初,即设置若干真实类别和若干虚构类别。其中,真实类别为真实样本所属的实际类别。真实类别具有实际的含义,用于指代具体存在的类别,例如猫、狗、或者鱼等。虚构类别不指代任何实际存在的具体类别;而正因为此,虚构类别可以在后续与任意一种具有实际含义的具体类别进行绑定,从而将虚构类别绑定为该具体类别。
每一虚构类别在特征空间占据一定的空间,以适配未来可能出现的新类别。为了对分类模型进行训练,一方面使用已有的样本数据,即真实样本;另一方面,为了提高分类模型对未知数据的泛化能力,本申请中还提出虚构的样本数据进行训练,即虚构样本。
虚构样本可以是基于已有的样本数据得到的,也可以是基于经验数据构建的。示例性地,一个虚构样本可以是一个或多个真实样本构建得到。例如,一个虚构样本可以是对一个真实样本进行数据调整得到。例如,对于图像样本,虚构图像样本可以是对真实图像样本中的像素值进行增大或减少得到,也可以是对真实图像样本进行镜像处理、或轴对称处理得到。虚构样本也可以是基于两个或两个以上的真实样本构建得到。例如,一个虚构样本可以是对两个真实样本进行加权求和得到。
具体地,计算机设备获取目标分类模型,该目标分类模型预设有一个或多个真实类别,以及一个或多个虚构类别。
目标分类模型可以支持对真实样本进行预测,以预测其属于哪一真实类别。对于虚构样本,目标分类模型也可以对其进行预测以输出相应的类别。在训练完成后,训练好的目标分类模型所支持的虚构类别,则用于后续与新增类别进行绑定,从而将预设的一种虚构类别确定为新增的某种类别,由此能够支持对样本数据进行预测,以输出其属于新增的哪一类别。
步骤S304,获取新增样本,新增样本所属的新增类别不同于任一真实类别。
具体地,在获取训练好的目标分类模型以后,在出现新增的类别的情况下,计算机设备获取新增样本,以对训练好的目标分类模型进行更新,从而使得目标分类模型能够支持该新增类别的预测。
计算机设备获取新增样本时,同时获取新增样本所属的新增类别。示例性地,新增样本携带有新增类别的类别标签。新增类别指代存在实际含义的具体类别。新增样本可以是任何不同于已有的真实类别的类别。比如,已有的真实类别包括猫、狗,则新增类别可以是鱼、昆虫等。新增样本可以为一个或多个。
步骤S306,将新增样本输入至目标分类模型,并通过目标分类模型提取新增样本的特征向量。
在已经训练好目标分类模型对各种虚构类别的支持的情况下,无需再对目标分类模型重新训练,而是通过新增样本对训练好的目标分类模型进行更新,即使得该目标分类模型能够支持对新增类别的预测。
其中,通过新增样本对训练好的目标分类模型进行更新,指的是基于该新增样本,将预留的虚构类别绑定为明确的新增类别。
具体地,计算机设备将新增样本输入至目标分类模型进行前向传播,并通过目标分类模型提取新增样本的特征向量。在新增样本为多个的情况下,计算机设备通过目标分类模型,分别对各个新增样本进行特征提取,从而得到各个新增样本各自对应的特征向量。
步骤S308,确定特征空间中与各个虚构类别分别对应的目标代表特征,并基于特征向量与各目标代表特征间的差异,确定与新增样本匹配的目标虚构类别。
其中,虚构类别对应的代表特征指的是特征空间中相应虚构类别的类中心。各个虚构类别各自对应的目标代表特征,可以是基于多次迭代训练后得到。同理,真实类别也具有对应的代表特征,指的是特征空间中相应真实类别的类中心。每个类别对应的目标代表特征可以基于相应类别的一或多个样本数据的特征向量得到。
在一般的分类模型的训练任务中,每一个预设的类别会形成一个类中心,分类模型会将与各类别对应的样本数据的特征向量预测到相应的类中心附近,这样分类模型才能对样本数据所属的类别输出较高的预测概率值。
为了便于理解,下面结合图示进行说明。
如图4所示,假设预设有两个真实类别:真实类别k1、真实类别k2,并预留有两个虚构类别:虚构类别v1和虚构类别v2。在模型训练之初,所有类别的类中心可以是随机初始化的。经过不断地迭代训练,各个类别的类中心也随之发生变化;在最终目标分类模型训练完成后,各个类别的类中心也随之确定,即得到了各个类别的目标代表特征。在图4中,各个实心黑色圆圈分别表示不同类别的类中心。类中心及其附近区域均对应于该类中心所代表的类别。
当样本数据的特征向量映射到特征空间中的某一位置时,计算机设备可以基于该位置与各个类中心的位置,来判断是否落入某一类别所具有的特征空间的区域范围,以此确定该样本数据是否属于该类别。
具体地,在得到一个或多个新增样本的特征向量之后,对于每个新增样本,计算机设备基于该新增样本的特征向量在特征空间的位置,以及各个虚构类别各自对应的目标代表特征在特征空间的位置,并基于两种位置之间的差异,来确定该新增样本的特征向量与哪一虚构类别的类中心最为接近,进而以此确定与该新增样本相匹配的目标虚构类别。
其中,计算机设备基于特征向量与各代表特征间的差异,确定与新增样本匹配的目标虚构类别,包括:计算机设备基于特征向量与各目标代表特征之间的距离,将距离最小的虚构类别作为与新增样本匹配的目标虚构类别。
在一些实施例中,对于同属于一个新增类别的多个新增样本,计算机设备可以分别计算各个新增样本的特征向量与每个虚构类别的目标代表特征之间的距离,并对计算得到的多个距离进行例如求和、加权求和、或者求均值等中的一种或多种数值运算,得到与每个虚构类别的目标代表特征之间的最终的距离,并以该最终的距离作为判断依据,以将最接近的虚构类别作为与新增样本匹配的目标虚构类别。
例如,对于同属于一个新增类别的多个新增样本x1、x2、x3,计算机设备分别计算
各个新增样本的特征向量、、与每个虚构类别的目标代表特征之间的距
离。例如,各个新增样本的特征向量与虚构类别v1的目标代表特征之间的距离分别为d1、
d2、d3,与虚构类别v2的目标代表特征之间的距离分别为d4、d5、d6。则计算机设备对各个新
增样本的特征向量与虚构类别v1的目标代表特征之间的多个距离进行均值处理,得到均值
距离;对各个新增样本的特征向量与虚构类别v2的目标代表特征之
间的多个距离进行均值处理,得到均值距离。进而,计算机设备比较
均值距离与,将其中较小值对应的虚构类别作为与新增样本匹配的目标虚构类别。
在一些实施例中,对于同属于一个新增类别的多个新增样本,计算机设备可以分别提取得到各个新增样本的特征向量,各个新增样本的特征向量在特征空间中构成一个特征分布。对于每个虚构类别,计算机设备也可以得到对应于每个虚构类别的全部样本数据的特征分布。进而,计算机设备可以计算新增类别的特征分布与各个虚构类别的特征分布之间的差异,以此确定新增类别与哪一虚构类别最为接近,以将最接近的虚构类别作为与新增样本匹配的目标虚构类别。
示例性地,计算新增类别的特征分布与各个虚构类别的特征分布之间的差异,可以是计算特征分布之间的相似度。其中,特征分布之间的相似度,可以是基于新增类别的各个新增样本的特征向量分别与每个虚构类别的全部样本数据的特征向量之间的距离,进行例如求和、加权求和、或者求均值等中的一种或多种数值运算得到。
步骤S310,将目标虚构类别更新为新增类别,以使得目标分类模型支持对新增类别的预测。
具体地,在确定与新增样本匹配的目标虚构类别之后,计算机设备即可将该目标虚构类别分配给该新增样本所属的新增类别。具体而言,计算机设备将该目标虚构类别更新为新增类别,以使得目标分类模型支持对新增类别的预测。由此,无需对目标分类模型重新训练,即可实现对新增类别的预测。
上述分类模型的增量训练方法中,通过真实样本和虚构样本共同训练,得到目标分类模型,并在获取了新增样本且该新增类别不属于已有的真实类别的情况下,基于训练好的目标分类模型提取特征向量,将该特征向量与经训练后得到的各个虚构类别的目标代表特征进行比较,从而基于比较得到的差异来确定该新增样本所属的目标虚构类别,由此,将该目标虚构类别更新为该新增类别,后续即可实现对该新增类别的数据的支持。通过上述方式,在增加了新的类别后,无需对原有的分类模型重新进行训练,只需要将所预留的一种虚构类别确定为新的类别即可,极大地提高了分类模型的迭代更新效率。同时,由于预设了虚构类别,在增加新的类别后只需更新相应的虚构类别,不会改变原有的类别的分布,使得分类模型在学习新数据的同时不会影响到其对旧数据已有的支持。
本申请实施例提供的分类模型的增量训练方法,利用了增量学习的方式进行训练。增量学习的方式是指分类模型在对现有数据的支持不变的情况下,通过仅对新数据的训练,使得分类模型对新数据也能有很好的支持。
以下结合图示进行形象地说明。
如图5中(a)所示,假设有类别1、类别2和类别3,各个类别在特征空间中分别占据了一部分区域。如果对样本数据提取得到的特征向量落入某一区域,则分类模型输出该样本数据属于该区域对应的类别的预测结果。
由于传统的分类任务的训练中,类别的数量是固定的,为了提高准确性,各个类别各自所占据的区域构成了整个特征空间。
然而,增量学习的难点在于,在学习新数据的同时,分类模型的预测分布会发生变化,使其更适合当前数据,从而对已有数据的支持产生遗忘。换言之,对于新增类别的出现,当前被完全占据的特征空间无法很好的兼顾已有的类别和新增的类别。如果基于新增的样本数据重新进行训练,重新训练后的分类模型会牺牲掉一部分已有类别所占据特征空间的区域,然后将该区域分配给新增的类别。则就会导致原有的样本数据的预测结果出现偏差。
因此,如何能保证分类模型在学习新数据的同时,保持对已有数据的支持不变,是面临新增类别的场景下的技术难题。
有鉴于此,本申请的发明构思在于,提出了一种虚拟原型学习(VirtualPrototypes Learning)的方式,在最初的训练中就将部分的特征空间区域进行保留,如图5中(b)所示。即,在最初模型训练时,即引入一定数量的虚拟原型,每个虚拟原型对应于一个虚构类别。与已有的类别相同地,每个虚拟原型也会占据特征空间中的一部分区域。
如图5中(b)所表征的特征空间所示,除了已有的类别1、类别2和类别3各自占据一部分区域以外,还为未来可能新增的类别预留一定的区域,在未来出现新增类别之后,再通过分配的形式将预留的区域分配给新增的类别。这样,新增的类别不会抢占已有的类别的特征空间区域,同时能够快速支持对新增类别的预测。
基于上述构思,下面介绍目标分类模型是如何经真实样本和虚构样本共同训练得到的。
在一些实施例中,如图6所示,获取经真实样本和虚构样本共同训练得到的目标分类模型,包括:
步骤S602,获取真实样本和虚构样本,虚构样本是基于真实样本构建得到。
具体地,计算机设备通过本地提取或网络下载等方式,获取一或多个真实样本。计算机设备再基于所获取的真实样本,构建得到一或多个虚构样本。
基于真实样本和虚构样本共同对分类模型进行迭代训练,每一次迭代训练中均需要真实样本和虚构样本。每一次迭代训练中,输入分类模型的样本数量可以根据实际需求设置。示例性地,在一次迭代训练中,输入若干真实样本,并基于若干真实样本随机构建虚构样本。
由此,对待训练的分类模型进行多次迭代训练,最终得到训练好的目标分类模型。基于真实样本和虚构样本共同训练得到的目标分类模型,既能够支持对真实类别的预测,也能够支持对虚构类别的预测。
为了便于理解,下面以一次迭代中对一个真实样本和一个虚构样本所执行的操作为例进行说明。但需理解的是,通常训练中一次迭代包括多个真实样本和多个虚构样本,对于每一次迭代训练中所输入的每个真实样本和每个虚构样本,计算机设备通过分类模型均执行相应类似的操作。
步骤S604,通过待训练的分类模型对真实样本进行预测,并基于预测得到的第一输出确定真实样本对应于第一目标类别的第一损失,第一目标类别包括真实样本所属的目标真实类别、和与真实样本匹配的目标虚构类别。
具体地,对于真实样本,计算机设备通过待训练的分类模型,提取该真实样本的特征向量,并基于该特征向量进行预测,输出该真实样本属于哪一真实类别的预测结果,该预测结果中包括了该真实样本分别对应于各个类别的概率值。
其中,第一输出可以为一维向量或N维向量(N=k+v,k为真实类别的数量,v为虚构类别的数量),其特征维度与预设类别的数量相一致。
举例而言,假设预设有k个真实类别和v个虚构类别,对于输入的真实样本x,计算机设备通过待训练的分类模型提取该真实样本x的特征向量,并基于该特征向量进行预测得到第一输出为。其中,表示真实样本x分别与各个真实类别相比,是否属于相应的真实类别,例如为0,则表示真实样本x不属于真实类别1;为1,则表示真实样本x属于真实类别2。类似地,表示真实样本x分别与各个虚构类别相比,是否属于相应的虚构类别。
由此,对于真实样本,计算机设备基于待训练的分类模型对其预测输出的真实类别和该真实样本本身实际所属的目标真实类别,即可确定真实样本对应于目标真实类别的损失。例如,对于真实样本x,基于第一输出与该真实样本x本身实际所属的真实类别y,即可确定真实样本对应于目标真实类别的损失。损失越小,表明第一输出中包含的各个预测概率中的最大值对应与该目标真实类别的可能性越大,也就说明预测结果越准确。
示例性地,假设预设有2个真实类别k1、k2和1个虚构类别v1,所构建的预测结果的形式为。对于输入的真实样本x,计算机设备通过待训练的分类模型中的提取该真实样本x的特征向量,并通过该分类模型中的Softmax层输出第一输出为。基于该第一输出,计算机设备基于该真实样本x本身所属的目标真实类别y,即可确定该真实样本对应于目标真实类别的损失。
除了预设有真实类别以外,本申请中还预设有虚构类别。虚构类别本身是不存在任何样本数据的,因此,需要将真实样本引入对虚构类别的损失计算中。而由于该真实样本本身属于某一真实类别,所以在计算该真实样本和虚构类别之间的损失时,需要将其所属的真实类别屏蔽,以规避其带来的影响。
因此,计算机设备基于对该真实样本预测得到的预测结果转化得到的第一输出,以及该真实样本本身实际所属的目标真实类别,在屏蔽该真实样本本身实际所属的目标真实类别之后,模拟该真实样本不属于目标真实类别,而是属于其他类别的预测结果。基于该属于其他类别的预测结果,再假设该真实样本属于某一虚构类别来计算损失,由此将真实样本引入虚构类别的训练中。
为此,计算机设备在各个虚拟类别中,确定其中一个虚拟类别作为与真实样本相匹配的目标虚拟类别。例如,对于真实样本x,计算机设备确定与该真实样本x相匹配的目标虚拟类别。进而,基于模拟的真实样本属于其他类别的预测结果、以及该与真实样本相匹配的目标虚拟类别,即可确定该真实样本对应于目标虚构类别的损失。
由此,对于真实样本,计算机设备通过待训练的分类模型,基于预测得到的第一输出确定真实样本对应于其所属的目标真实类别的损失,并基于该第一输出确定该真实样本对应于与其匹配的目标虚构类别的损失,以共同构成真实样本对应于第一目标类别的第一损失。
步骤S606,通过待训练的分类模型对虚构样本进行预测,并基于预测得到的第二输出确定虚构样本对应于第二目标类别的第二损失,第二目标类别包括分别与虚构样本匹配的目标真实类别和目标虚构类别。
单独使用真实样本来对虚构类别进行优化训练,会使得虚构类别在特征空间中的类中心的位置只依赖有限的数据,导致其样本分布不够广泛,进而在未来面对未知的数据时,无法支持对未知的数据进行准确的预测。
因此,本申请还基于构建的虚构样本对待训练的分类模型进行训练。
具体地,对于虚构样本,计算机设备通过待训练的分类模型,提取该虚构样本的特征向量,并基于该特征向量进行预测,输出该虚构样本属于何种类别的预测结果。由于虚构样本本身即为构建的,其并不存在真实所属的具体类别。因此,与真实样本对应于真实类别的损失类似,计算机设备首先确定与虚构样本匹配的目标虚构类别,用于确定该虚构样本对应于其“属于”的目标虚构类别的损失。
其中,与虚构样本匹配的目标虚构类别,可以是基于用于构建该虚构样本的一或多个的真实样本所属的目标真实类别得到。在一些实施例中,在步骤S604中,计算机设备得到了与真实样本相匹配的目标虚构类别,则在本步骤中,计算机设备可以基于该与真实样本相匹配的目标虚构类别,确定与虚构样本匹配的目标虚构类别。例如,计算机设备将该与真实样本相匹配的目标虚构类别,作为与虚构样本匹配的目标虚构类别。又如,计算机设备基于用于构建该虚拟样本的多个真实样本各自对应的目标虚构类别,融合得到与虚构样本匹配的目标虚构类别。
同样地,由于虚构样本本身并不存在真实所属的具体类别,需要将虚构样本引入对真实类别的损失计算中。因此,计算机设备在确定该虚构样本“属于”的目标虚构类别之后,将其“属于”的目标虚构类别屏蔽,模拟虚构样本不属于该目标虚构类别,而是属于其他类别的预测结果。基于该属于其他类别的预测结果,再假设该虚构样本属于某一真实类别来计算损失,由此将虚构样本引入真实类别的训练中。
有鉴于此,计算机设备在各个真实类别中,确定其中一个真实类别作为与该虚构样本相匹配的目标真实类别。例如,对于虚构样本z,计算机设备确定与该真实样本z相匹配的目标虚构类别。进而,基于模拟的虚构样本属于其他类别的预测结果、以及该与虚构样本相匹配的目标真实类别,即可确定该虚构样本对应于目标真实类别的损失。
由此,对于虚构样本,计算机设备通过待训练的分类模型,基于预测得到的第二输出确定虚构样本对应于与其匹配的目标虚构类别(即该虚构样本“属于”的虚构类别)的损失,并基于该第二输出确定该虚构样本对应于与其匹配的目标真实类别的损失,以共同构成虚构样本对应于第二目标类别的第一损失。
需要说明的是,上述术语第一目标类别和第二目标类别等在本申请中用来描述样本所对应的目标类别,但是这些目标类别不应当被这些术语限制。这些术语仅用来将一个目标类别与另一个目标类别进行区分。例如,第一目标类别可以被称作第二目标类别,并且类似地,第二目标类别可以被称作第一目标类别,而不脱离各种所描述的实施例的范围,但是除非上下文以其他方式明确指出,否则它们不是同一个目标类别。相似的情况还包括第一损失和第二损失、第一损失函数和第二损失函数等。
步骤S608,基于第一损失和第二损失,构建目标损失函数,通过目标损失函数对待训练的分类模型进行迭代训练,直至达到训练停止条件时停止,得到训练完成的目标分类模型。
其中,训练停止条件包括但不限于:训练迭代次数达到预设次数、训练时长达到预设时长、或者目标损失函数的损失达到最小值等中的一种或多种。
具体地,基于针对于真实样本的第一损失和针对于虚构样本的第二损失,计算机设备即可构建目标损失函数,以基于该目标损失函数对该待训练的分类模型进行迭代训练。
在一些实施例中,目标损失函数可以基于第一损失和第二损失之和构建得到。例如,第一损失为L1,第二损失为L2,则目标损失函数L=L1+L2。则在对分类模型进行迭代训练的过程中,可以以该目标损失函数的目标损失最小化为优化目标进行训练,直到目标损失达到最小值或者小于阈值时,计算机设备确定达到训练停止条件,则停止迭代训练,得到训练完成的目标分类模型。
在另一些实施例中,目标损失函数可以基于第一损失和第二损失组合得到。例如,在以目标损失函数最小化为优化目标的情况下对分类模型进行训练时,可以分别为第一损失和第二损失预设相应的阈值,当第一损失和第二损失均小于相应的阈值时,计算机设备确定达到训练停止条件,则停止迭代训练,得到训练完成的目标分类模型。
上述实施例中,通过获取真实样本,并构建虚构样本,基于真实样本和虚构样本共同进行训练,并分别计算真实样本对应的第一损失和虚构样本对应的第二损失,基于第一损失和第二损失来最终确定目标损失函数,以该目标损失函数为约束来训练分类模型,不仅能够使得训练好的目标分类模型能够支持对各个真实类别的准确预测,还能够在不改变对真实类别的预测分布的情况下,实现对虚构类别的预测。
在一些实施例中,通过目标损失函数对待训练的分类模型进行迭代训练,包括:通过目标损失函数对待训练的分类模型进行多次迭代训练,并在每次迭代训练后,确定当次迭代训练对应的梯度,并基于梯度的反向传播,对特征空间中每个类别各自对应的代表特征进行更新;其中,最后一次迭代训练完成后所得到的每个类别各自对应的代表特征,为各个类别最终的代表特征。
具体地,计算机设备通过目标损失函数对待训练的分类模型进行多次迭代训练。每一次迭代训练后,计算机设备本次迭代训练对应的梯度,并基于梯度进行反向传播,以对该待训练的分类模型进行参数更新。其中,在反向传播的过程中,计算机设备还对特征空间中每个类别(包括各真实类别和各虚构类别)各自对应的代表特征进行更新。也就是说,每一次迭代训练时各个类别的类中心的位置,是基于上一次迭代训练后对类中心进行更新后的新的位置。
由此,在进行多次迭代训练后,当训练完成时,计算机设备将最后一次迭代训练时所得到的每个类别各自对应的代表特征,作为各个类别最终的代表特征,就最终的类中心。
上述实施例中,通过迭代更新每个类别的代表特征,在多次迭代训练后,每个类别的类中心趋于固定,也就能够在特征空间中划分相应的区域范围,以此能够作为后续对输入的数据进行预测的依据。
本申请中在最初模型训练时即引入一定数量的虚拟原型,以为后续新增的类别预留位置。但是引入虚拟原型也就意味着当前没有对应的样本数据。因此,在模型训练阶段,需要构建新的损失函数来对本身不存在样本数据的虚构类别进行支持。
为此,本申请设计了新的损失函数,以同时支持对真实样本和虚构样本的训练。分类模型整体的损失函数包括两部分,一部分为基于真实样本构建的第一种损失函数,称之为第一损失函数;另一部分则为基于虚构样本构建的第二种损失函数,称之为第二损失函数。
下面首先介绍第一损失函数的构建方法。
在一些实施例中,通过待训练的分类模型对真实样本进行预测,并基于预测得到的第一输出确定真实样本对应于第一目标类别的第一损失,包括:通过待训练的分类模型提取真实样本的特征向量,并基于真实样本的特征向量进行预测,得到真实样本对应于所有类别的第一概率;基于第一概率、以及真实样本所属的目标真实类别,确定真实样本对应于目标真实类别的第一原始损失;基于第一概率,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率;基于第一假设概率,确定真实样本对应于所匹配的第一虚构损失;基于第一原始损失和第一虚构损失,确定真实样本对应于第一目标类别的第一损失。
具体地,对于真实样本,计算机设备通过待训练的分类模型,提取该真实样本的特征向量,并基于该特征向量进行预测,输出该真实样本对应于所有类别的第一概率,所有类别包括了所有真实类别和所有虚构类别。该第一概率即为该真实样本的预测结果。
为了以示区分,真实样本本身所属的真实类别,称为目标真实类别。目标真实类别已知。由此,基于第一概率和已知的目标真实类别,计算机设备即可计算该真实样本对应于该目标真实类别的损失,称为第一原始损失。
示例性地,第一原始损失可以通过如下公式(3)表示:
上述实施例中,通过模拟真实样本不属于目标真实类别,而是属于其他类别的情况,构建真实样本对应于第一目标类别的第一损失,由此能够将真实样本引入虚构类别的训练中。
需要说明的是,通常,每一个类别均设置有相应的类别标签,以清楚地区分各个类别。例如,真实类别1的类别标签为1,真实类别2的类别标签为2……虚构类别1的类别标签为8,虚构类别2的类别标签为9,等等。因此,在计算过程中,公式中的y为类别标签的值。
基于第一概率,计算机设备再确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率。示例性地,计算机设备基于第一概率的相反值,来确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率。
在一些实施例中,基于第一概率,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率,包括:基于真实样本所属的目标真实类别,确定与真实样本对应的二值化向量,二值化向量的维度与预设类别的数量相匹配;对与真实样本对应的二值化向量进行逆运算,得到与真实样本对应的二值化逆向量;基于第一概率和与真实样本对应的二值化逆向量,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率。
具体地,计算机设备基于真实样本本身所属的目标真实类别,确定与真实样本对应的二值化向量。二值化向量的维度与预设类别的数量相匹配。例如,假设预设有k个真实类别和v个虚构类别,则二值化向量的维度为k+v。
接着,计算机设备对该二值化向量进行逆运算,得到二值化逆向量。其中,逆运算例如为取反运算。例如,计算机设备可以通过进行取反处理,以得到二值化逆向量,用于表示在屏蔽了目标真实类别以后,该真实样本对应于其他类别的概率。例如,二值化向量为[0,0,1],则二值化逆向量为[1,1,0]。
由此,计算机设备基于第一概率和二值化逆向量,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率。
示例性地,计算机设备可以通过如下公式(4)计算第一假设概率:
上述实施例中,通过获取与真实样本对应的二值化向量,并通过对该二值化向量进行逆运算,来模拟真实样本不属于目标真实类别,而是属于其他类别的情况,由此能够将真实样本引入虚构类别的训练中。
由此,在得到第一假设概率后,计算机设备基于该第一假设概率,确定真实样本对应于目标虚构类别的第一虚构损失。
在一些实施例中,基于第一假设概率,确定真实样本对应于所匹配的目标虚构类别的第一虚构损失,包括:确定与真实样本匹配的目标虚构类别;基于第一假设概率、以及目标虚构类别对应的虚构类别标签,确定真实样本对应于虚构类别的第一虚构损失。
具体地,计算机设备首先确定与真实样本匹配的目标虚构类别。由于真实样本本身是对应于目标真实类别的,其不属于任何虚构类别。因此,计算机设备在各个虚构类别中,选择一个虚构类别作为与真实样本匹配的目标虚构类别。
计算机设备可以按照各个标签,将与目标真实类别的类别标签最接近的虚构类别,作为与真实样本匹配的目标虚构类别。为了提高准确性,在一些实施例中,计算机设备可以在特征空间中确定真实样本最可能落入的虚构类别的区域范围,以此确定与真实样本匹配的目标虚构类别。
由此,基于第一假设概率、以及目标虚构类别对应的虚构类别标签,确定真实样本对应于虚构类别的第一虚构损失。
上述实施例中,通过与真实样本匹配的目标虚构类别,以及目标虚构类别对应的虚构类别标签,计算真实样本对应于目标虚构类别的第一虚构损失,从而解决虚构类别本身不存在样本数据的问题。
最终,计算机设备可以基于第一原始损失和第一虚构损失,构建真实样本对应于第一目标类别的第一损失。其中,第一损失可以为第一原始损失与第一虚构损失之和。
示例性地,计算机设备可以通过如下公式(5)构建计算第一损失:
上述实施例中,通过对真实样本计算在不存在虚构类别的情况下其本身的第一原始损失,并且计算在存在虚构类别的情况下相对于虚构类别的第一虚构损失,综合作为真实样本的损失,能够使得模型学习时既不改变对原有的数据的预测支持,又实现对虚构类别的预测支持。
其中,在确定与真实样本匹配的目标虚构类别时,可以基于各个虚构类别的代表特征(即类中心)进行判断。为此,在一些实施例中,确定与真实样本匹配的目标虚构类别,包括:确定特征空间中与各虚构类别分别对应的第一代表特征;第一代表特征为当次训练中与各虚构类别对应的代表特征;分别确定真实样本的特征向量与各第一代表特征之间的距离;将距离中的最小值对应的第一代表特征所代表的虚构类别,作为与真实样本匹配的目标虚构类别。
具体地,计算机设备在特征空间中,分别确定本次迭代训练过程中,与各虚构类别对应的代表特征,称为第一代表特征。计算机设备根据提取得到的该真实样本的特征向量,计算其与各虚构类别对应的第一代表特征之间的距离,并将距离中的最小值对应的第一代表特征所代表的虚构类别,作为与真实样本匹配的目标虚构类别。
示例性地,计算机设备可以通过如下公式(6)确定与真实样本匹配的目标虚构类别:
为了便于理解,以下结合图示进行形象地说明。如图7A所示,假设预设有两个真实类别k1和真实类别k2,以及两个虚构类别v1和v2,每个类别的代表特征在图中以实心黑色圆圈表示。对于真实样本,计算机设备通过待训练的分类模型提取得到的特征向量,在图中以空心实线圆圈表示。由此,计算机设备在图7A所示的特征空间中,分别计算该特征向量与虚构类别v1的第一代表特征的距离d1,和该特征向量与虚构类别v2的第一代表特征的距离d2。计算机设备基于d1与d2中的最小值,将最小值对应的第一代表特征所代表的虚构类别,作为与真实样本匹配的目标虚构类别。
上述实施例中,基于真实样本的特征向量在特征空间中与各个虚构类别的代表特征之间的差异,来将最接近的虚构类别作为目标虚构类别,能够尽可能提高模型训练的准确性。
以上描述了基于真实样本构建的第一损失。然而,单独使用真实样本去优化虚构类别会使得虚构类别的位置只依赖有限的数据,会导致其分布不够广泛,在未来面对未知的数据时如果丰富度不够的话一样无法很好的支持新的数据类别。因此,本申请中还设计第二种损失函数,以使用虚构样本来优化原有的真实分类。
在一些实施例中,通过待训练的分类模型对虚构样本进行预测,并基于预测得到的第二输出确定虚构样本对应于第二目标类别的第二损失,包括:通过待训练的分类模型提取虚构样本的特征向量,并基于虚构样本的特征向量进行预测,得到虚构样本对应于所有类别的第二概率;确定用于构建虚构样本的至少一个真实样本,并基于与至少一个真实样本匹配的目标虚构类别,确定虚构样本对应的目标虚构类别;基于第二概率、以及虚构样本对应的目标虚构类别,确定虚构样本对应于目标虚构类别的第二原始损失;基于第二概率,确定虚构样本对应于除目标虚构类别以外的其他类别的第二假设概率;基于第二假设概率,确定虚构样本对应于所匹配的目标真实类别的第二虚构损失;基于第二原始损失和第二虚构损失,确定虚构样本对应于第二目标类别的第二损失。
具体地,对于虚构样本,计算机设备通过待训练的分类模型,提取该虚构样本的特征向量,并基于该特征向量进行预测,输出该虚构样本对应于所有类别的第二概率,所有类别包括了所有真实类别和所有虚构类别。该第二概率即为该虚构样本的预测结果。
由于虚构样本本身不对应于任何类别,因此,需要确定与该虚构样本匹配的虚构类别,作为该虚构样本“属于”的目标虚构类别。为此,计算机设备确定用于构建虚构样本的至少一个真实样本,并基于与至少一个真实样本匹配的目标虚构类别,确定虚构样本对应的目标虚构类别。
例如,计算机设备可以基于用于构建该虚构样本的一个真实样本,将前面得到的与该真实样本匹配的目标虚构类别,作为虚构样本对应的目标虚构类别。
又如,计算机设备可以基于用于构建该虚构样本的多个真实样本,将各个真实样本各自匹配的目标虚构类别,融合得到虚构样本对应的目标虚构类别。示例性地,计算机设备可以将各个真实样本各自匹配的目标虚构类别的类别标签进行加权求和,得到虚构样本对应的目标虚构类别的类别标签,以确定虚构样本对应的目标虚构类别。
由此,基于第二概率、以及虚构样本对应的目标虚构类别,计算机设备即可确定虚构样本对应于目标虚构类别的第二原始损失。
示例性地,第二原始损失可以通过如下公式(7)表示:
上述实施例中,通过模拟虚构样本不“属于”目标虚构类别,而是属于其他类别的情况,构建虚构样本对应于第二目标类别的第二损失,由此能够将虚构样本引入真实类别的训练中。
基于第二概率,计算机设备再确定虚构样本对应于除目标虚构类别以外的其他类别的第二假设概率。示例性地,计算机设备基于第二概率的相反值,来确定虚构样本对应于除目标虚构类别以外的其他类别的第二假设概率。
类似地,在一些实施例中,基于第二概率,确定虚构样本对应于除目标虚构类别以外的其他类别的第二假设概率,包括:基于与虚构样本匹配的目标真实类别,确定与虚构样本对应的二值化向量;对与虚构样本对应的二值化向量进行逆运算,得到与虚构样本对应的二值化逆向量;基于第二概率和与虚构样本对应的二值化逆向量,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率。
具体地,计算机设备基于虚构样本“属于”的目标虚构类别,确定与虚构样本对应的二值化向量。
接着,计算机设备对该二值化向量进行逆运算,得到二值化逆向量。例如,计算机设备可以通过进行取反处理,以得到二值化逆向量,用于表示在屏蔽了目标虚构类别以后,该虚构样本对应于其他类别的概率。例如,二值化向量为[0,1,0],则二值化逆向量为[1,0,1]。
由此,计算机设备基于第二概率和二值化逆向量,确定虚构样本对应于除目标虚构类别以外的其他类别的第二假设概率。
示例性地,计算机设备可以通过如下公式(8)计算第二假设概率:
上述实施例中,通过获取与虚构样本对应的二值化向量,并通过对该二值化向量进行逆运算,来模拟虚构样本不属于目标虚构类别,而是属于其他类别的情况,由此能够将虚构样本引入真实类别的训练中。
由此,在得到第二假设概率后,计算机设备基于该第二假设概率,确定真实样本对应于目标虚构类别的第二虚构损失。
类似地,在一些实施例中,基于第二假设概率,确定虚构样本对应于目标真实类别的第二虚构损失,包括:确定与虚构样本匹配的目标真实类别;基于第二假设概率、以及与目标真实类别对应的真实类别标签,确定虚构样本对应于所匹配的目标真实类别的第二虚构损失。
具体地,计算机设备首先确定与虚构样本匹配的目标真实类别。由于虚构样本本身不对应于任何类别,因此,计算机设备在各个真实类别中,选择一个真实类别作为与虚构样本匹配的目标真实类别。
计算机设备可以按照各个标签,将与目标虚构类别的类别标签最接近的真实类别,作为与虚构样本匹配的目标真实类别。为了提高准确性,在一些实施例中,计算机设备可以在特征空间中确定虚构样本最可能落入的真实类别的区域范围,以此确定与虚构样本匹配的目标真实类别。
由此,计算机设备基于第二假设概率、以及目标真实类别对应的真实类别标签,确定虚构样本对应于目标真实类别的第二虚构损失。
上述实施例中,通过与虚构样本匹配的目标真实类别,以及目标真实类别对应的真实类别标签,计算虚构样本对应于目标真实类别的第二虚构损失,从而解决虚构样本本身并不对应于任何类别的问题。
最终,计算机设备可以基于第二原始损失和第二虚构损失,确定虚构样本对应于第二目标类别的第二损失。其中,第二损失可以为第二原始损失与第二虚构损失之和。
示例性地,计算机设备可以通过如下公式(9)构建计算第二损失:
上述实施例中,通过对虚构样本计算其假设属于某一种目标虚构类别的情况下的第二原始损失,并且假设属于某一种目标真实类别的情况下的第二虚构损失,综合作为虚构样本的损失,能够使得模型学习时既不改变对原有的数据的预测支持,又实现对虚构类别的预测支持。
其中,在确定与虚构样本匹配的目标真实类别时,可以基于各个真实类别的代表特征进行判断。为此,在一些实施例中,确定与虚构样本匹配的目标真实类别,包括:确定特征空间中与各真实类别分别对应的第二代表特征;所述第二代表特征为当次训练中与真实类别对应的代表特征;分别确定虚构样本的特征向量与各第二代表特征之间的距离;将各距离中的最小值对应的第二代表特征所代表的真实类别,作为与虚构样本匹配的目标真实类别。
具体地,计算机设备在特征空间中,分别确定本次迭代训练过程中,与各真实类别对应的代表特征,称为第二代表特征。计算机设备根据提取得到的该虚构样本的特征向量,计算其与各真实类别对应的第二代表特征之间的距离,并将距离中的最小值对应的第二代表特征所代表的真实类别,作为与虚构样本匹配的目标真实类别。
示例性地,计算机设备可以通过如下公式(10)确定与虚构样本匹配的目标真实类别:
示例性地,如图7B所示,假设预设有两个真实类别k1和真实类别k2,以及两个虚构类别v1和v2,每个类别的代表特征在图中以实心黑色圆圈表示。对于虚构样本,计算机设备通过待训练的分类模型提取得到的特征向量,在图中以空心实线圆圈表示。由此,计算机设备在图7B所示的特征空间中,分别计算该特征向量与真实类别k1的第二代表特征的距离d3,和该特征向量与虚构类别k2的第二代表特征的距离d4。计算机设备基于d3与d4中的最小值,将最小值对应的第二代表特征所代表的真实类别,作为与虚构样本匹配的目标真实类别。
上述实施例中,基于虚构样本的特征向量在特征空间中与各个真实类别的代表特征之间的差异,来将最接近的真实类别作为目标真实类别,能够尽可能提高模型训练的准确性。
由此,即构建了基于虚构样本的第二损失。计算机设备即可基于第一损失和第二损失,构建最终的目标损失函数。
基于构建的目标损失函数,可以对分类模型进行迭代训练。其中,在通过目标损失函数对待训练的分类模型进行迭代训练的过程中,还需要基于反向传播的原理对模型进行更新。这其中即包括了对各个类别的类中心进行更新。
由此,在得到训练好的目标分类模型以后,在面临新增的类别时,无需进行训练,即可直接根据新增的样本对目标分类模型进行更新。在一些实施例中,基于特征向量与各目标代表特征间的差异,确定与新增样本匹配的目标虚构类别,包括:确定特征向量与各目标代表特征间的距离;将各距离中的最小值对应的目标代表特征所代表的虚构类别,作为与新增样本匹配的目标虚构类别。
具体地,计算机设备在特征空间中确定各个虚构类别的代表特征,即训练完成后各个虚构类别的类中心。基于该新增样本的特征向量,计算机设备计算该新增样本的特征向量与各虚构类别的代表特征之间的距离,并将各距离中的最小值对应的代表特征所代表的虚构类别,作为与新增样本匹配的目标虚构类别。
在一些实施例中,对于同属于一个新增类别的多个新增样本,计算机设备可以分别提取得到各个新增样本的特征向量,各个新增样本的特征向量在特征空间中构成一个特征分布。对于每个虚构类别,计算机设备也可以得到对应于每个虚构类别的全部样本数据的特征分布。进而,计算机设备可以计算新增类别的特征分布与各个虚构类别的特征分布之间的差异,以此确定新增类别与哪一虚构类别最为接近,以将最接近的虚构类别作为与新增样本匹配的目标虚构类别。
上述实施例中,通过计算相似度或距离,来确定与新增样本最接近的目标虚构类别,能够直接将分布最相似虚构类别直接作为新增类别,由此无需对目标分类模型重新进行训练,即可实现对新增类别的数据的预测支持。同时,通过此种方式,能够使得目标分类模型对已有的真实类别的样本数据的预测支持不变。
由此,模型能够支持对新增类别的预测。在具体的应用场景下,在一些实施例中,方法还包括:获取待分类数据;将待分类数据输入至目标分类模型中,通过目标分类模型提取待分类数据的特征向量;基于待分类数据的特征向量,对待分类数据进行预测,以确定待分类数据所属的目标类别,目标类别为任一真实类别或任一新增类别。
在对于未知类别的分类数据时,除了已有的各真实类别以外,计算机设备还可以基于更新后的目标分类模型输出该分类数据是否属于新增类别的预测结果。
具体地,计算机设备将待分类数据输入至目标分类模型中,通过目标分类模型提取待分类数据的特征向量,并基于该特征向量在特征空间所落入的区域,判断其属于哪一真实类别、或哪一新增类别。计算机设备通过目标分类模型对该待分类数据预测得到的结果,即为该待分类数据所属的目标类别。
上述实施例中,通过目标分类模型对待分类数据提取特征向量,并基于特征向量输出该待分类数据属于哪一类别,能够准确地预测该待分类数据的分类预测结果,并且通过利用上述方式训练的目标分类模型进行预测,在支持对已有的真实类别的预测以外,还能够支持对新增类别的预测。
由于模型在训练之前预留的虚构类别的数量是预先设置好的,随着后续分类越来越多的情况,可能原本预留的虚构类别的数量不够。在某一种虚构类别确定为新增类别后,如果新增类别的数据量越来越多,特征空间不足,甚至出现空间抢占的情况,则此时计算机设备再对目标分类模型进行重新训练。
为此,在一些实施例中,计算机设备将新增类别的相关数据,作为其中一种真实类别,并重新获取新的真实样本和新的虚构样本,以对目标分类模型重新进行训练。
而在一些情况下,新增类别具有时效性,可能在一段时间内基于业务需求需要目标分类模型支持对该新增类别进行预测,而一段时间过去后,业务需求已无需支持对该新增类别的预测。如果一直让该新增类别占用一个虚构类别,则会造成资源的浪费。因此,在这种情况下,本申请还可以将新增类别取消,并将目标分类模型中与新增类别相关的数据删除,以将绑定了该新增类别的目标虚构类别,重置为不存在任何数据的虚构类别,即,重新作为预留的虚构类别,以用于再下一次对新增类别的预测支持。
基于本申请的发明构思,本申请提供的分类模型的增量训练方法能够应用于各种神经网络架构中,例如,AlexNet(基于LeNet的卷积神经网络)、VGG网络(Visual GeometryGroup Network,视觉几何群网络)、ResNet(残差卷积神经网络)、或者GoogleLeNet(基于Inception的卷积神经网络)等。
以ResNet网络作为分类模型的主干网络为例,该主干网络中至少包括若干卷积层和一个全连接层。如图8所示,示例性地,计算机设备采用ResNet-18网络作为主干网络,包括若干卷积层和一个全连接层,其中,每两个卷积层计算的残差输入到下一个卷积层中进行计算。利用ResNet-18网络能够与各种业务实现良好的兼容。
其中,在模型训练时使用256的批大小(batch size),并在每个批次中随机构建一或多个虚构样本。示例性地,分类模型在训练中使用SGD(随机梯度下降)进行迭代优化。初始学习率可以设置为0.1。计算机设备可以利用余弦退火(cosine annealing)的模式进行训练,以实现更好地模型收敛。
本申请可以应用于多种场景,例如视频分类、图片分类、小说文本分类、或者音乐音频分类等。
以视频分类的应用场景为例,该应用场景应用上述的分类模型的增量训练方法,具体可以是对影视内容进行分类预测。该应用例如如下:获取经真实的视频样本和虚构的视频样本共同训练得到的目标分类模型。该目标分类模型支持对视频类别的预测,例如电影、综艺、动画、以及体育等视频类别,同时预留有若干虚构类别。对于新增的类别,例如游戏类别,计算机设备获取与该游戏类别对应的新增样本,并将该新增样本输入至目标分类模型,预测与该新增样本最接近的目标虚构类别,并将该目标虚构类别绑定为游戏类别。由此,在后续对未知视频类别的视频数据进行分类预测时,还可以预测该视频数据是否属于游戏类别。
以文本分类的应用场景为例,该应用场景应用上述的分类模型的增量训练方法,具体可以是对小说内容进行分类预测。该应用例如如下:获取经真实的小说样本和虚构的小说样本共同训练得到的目标分类模型。该目标分类模型支持对小说类别的预测,例如写实、历史、穿越、以及玄幻等小说类别,同时预留有若干虚构类别。对于新增的类别,例如科幻类别,计算机设备获取与该科幻类别对应的新增样本,并将该新增样本输入至目标分类模型,预测与该新增样本最接近的目标虚构类别,并将该目标虚构类别绑定为科幻类别。由此,在后续对未知小说类别的小说数据进行分类预测时,还可以预测该小说数据是否属于科幻类别。
以音频分类的应用场景为例,该应用场景应用上述的分类模型的增量训练方法,具体可以是对音乐类型进行分类预测。该应用例如如下:获取经真实的音乐样本和虚构的音乐样本共同训练得到的目标分类模型。该目标分类模型支持对音乐类别的预测,例如流行、电子、摇滚、以及乡村等音乐类别,同时预留有若干虚构类别。对于新增的类别,例如蓝调类别,计算机设备获取与该蓝调类别对应的新增样本,并将该新增样本输入至目标分类模型,预测与该新增样本最接近的目标虚构类别,并将该目标虚构类别绑定为蓝调类别。由此,在后续对未知音乐类别的音乐数据进行分类预测时,还可以预测该音乐数据是否属于蓝调类别。
对于上述视频、文本、音频的分类,可以基于对相应数据的分类,实现对用户的个性化推荐。需要说明的是,对用户的个性化推荐是基于用户授权许可后执行的,用户也可以拒绝相应的推荐信息。
下面结合一种实际的应用场景,以一个具体的示例对本申请提供的分类模型的增量训练方法进行说明。
在一个具体的示例中,计算机设备对于待训练的分类模型,获取真实样本和虚构样本,通过待训练的分类模型提取真实样本的特征向量,并基于真实样本的特征向量进行预测,得到真实样本对应于所有类别的第一概率。
一方面,计算机设备基于第一概率、以及真实样本所属的目标真实类别,确定真实样本对应于目标真实类别的第一原始损失。
另一方面,计算机设备基于真实样本所属的目标真实类别,确定与真实样本对应的二值化向量,再对与真实样本对应的二值化向量进行逆运算,得到与真实样本对应的二值化逆向量。进而,计算机设备基于第一概率和与真实样本对应的二值化逆向量,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率。此外,计算机设备在特征空间中,确定与各虚构类别分别对应的当前代表特征,并分别确定真实样本的特征向量与各当前代表特征之间的距离。由此,计算机设备将距离中的最小值对应的当前代表特征所代表的虚构类别,作为与真实样本匹配的目标虚构类别。进而,计算机设备基于第一假设概率、以及目标虚构类别对应的虚构类别标签,确定真实样本对应于目标虚构类别的第一虚构损失。
由此,计算机设备即可基于第一原始损失和第一虚构损失,构建真实样本对应于第一目标类别的第一损失。
与此同时,计算机设备还通过待训练的分类模型对虚构样本进行预测,并基于预测得到的第二输出确定虚构样本对应于第二目标类别的第二损失,第二目标类别包括分别与虚构样本匹配的目标真实类别和目标虚构类别。具体过程与上述实施例类似,此处不再赘述。
最终,计算机设备即可基于第一损失和第二损失,构建目标损失函数,通过目标损失函数对待训练的分类模型进行迭代训练,直至达到训练停止条件时停止,得到训练完成的目标分类模型。
在面临需要新增类别的情况下,计算机设备获取新增样本,将新增样本输入至目标分类模型,并通过目标分类模型提取新增样本的特征向量,确定特征向量与各代表特征间的距离,并将各距离中的最小值对应的代表特征所代表的虚构类别,作为与新增样本匹配的目标虚构类别。由此,计算机设备将目标虚构类别更新为新增类别,以使得目标分类模型支持对新增类别的预测。
由此,在对于未知类别的分类数据时,除了已有的各真实类别以外,计算机设备还可以基于更新后的目标分类模型输出该分类数据是否属于新增类别的预测结果。例如,计算机设备将待分类数据输入至目标分类模型中,通过目标分类模型提取待分类数据的特征向量,以基于该特征向量对待分类数据进行预测,从而确定待分类数据所属的目标类别,目标类别为任一真实类别或任一新增类别。
本申请实施例提供的分类模型的增量训练方法,能够快速支持新增类别,同时对已有类别的支持效果,甚至已有样本数据的特征向量都无需发生改变。在实际生产环境中,能够极大地节约模型重新训练的耗时成本、数据收集成本,也显著地节省了计算资源。同时在如此框架下训练出的分类模型,由于特征空间中各个类别的分布更稠密,因此预测结果的准确度高于在一般训练框架下得到的分类模型。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的分类模型的增量训练方法的分类模型的增量训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个分类模型的增量训练装置实施例中的具体限定可以参见上文中对于分类模型的增量训练方法的限定,在此不再赘述。
在一个实施例中,如图9所示,提供了一种分类模型的增量训练装置900,包括:模型模块901、获取模块902、输入模块903、分类模块904和更新模块905,其中:
模型模块901,用于获取经真实样本和虚构样本共同训练得到的目标分类模型,所述目标分类模型支持对虚构类别和真实类别的预测。
获取模块902,用于获取新增样本,新增样本所属的新增类别不同于任一真实类别。
输入模块903,用于将新增样本输入至目标分类模型,并通过目标分类模型提取新增样本的特征向量。
分类模块904,用于确定特征空间中与各个虚构类别分别对应的目标代表特征,并基于所述特征向量与各目标代表特征间的差异,确定与所述新增样本匹配的目标虚构类别。
更新模块905,用于将目标虚构类别更新为新增类别,以使得目标分类模型支持对新增类别的预测。
在一些实施例中,上述装置包括训练模块,用于获取真实样本和虚构样本,虚构样本是基于真实样本构建得到;通过待训练的分类模型对真实样本进行预测,并基于预测得到的第一输出确定真实样本对应于第一目标类别的第一损失,第一目标类别包括真实样本所属的目标真实类别、和与真实样本匹配的目标虚构类别;通过待训练的分类模型对虚构样本进行预测,并基于预测得到的第二输出确定虚构样本对应于第二目标类别的第二损失,第二目标类别包括分别与虚构样本匹配的目标真实类别和目标虚构类别;基于第一损失和第二损失,构建目标损失函数,通过目标损失函数对待训练的分类模型进行迭代训练,直至达到训练停止条件时停止,得到训练完成的目标分类模型。
在一些实施例中,训练模块还用于通过所述目标损失函数对所述待训练的分类模型进行多次迭代训练,并在每次迭代训练后,确定当次迭代训练对应的梯度,并基于所述梯度的反向传播,对特征空间中每个类别各自对应的代表特征进行更新;其中,最后一次迭代训练完成后所得到的每个类别各自对应的代表特征,为各个类别的目标代表特征。
在一些实施例中,训练模块还用于通过待训练的分类模型提取真实样本的特征向量,并基于真实样本的特征向量进行预测,得到真实样本对应于所有类别的第一概率;基于第一概率、以及真实样本所属的目标真实类别,确定真实样本对应于目标真实类别的第一原始损失;基于第一概率,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率;基于第一假设概率,确定真实样本对应于所匹配的目标虚构类别的第一虚构损失;基于第一原始损失和第一虚构损失,确定真实样本对应于第一目标类别的第一损失。
在一些实施例中,训练模块还用于基于真实样本所属的目标真实类别,确定与真实样本对应的二值化向量,二值化向量的维度与预设类别的数量相匹配;对与真实样本对应的二值化向量进行逆运算,得到与真实样本对应的二值化逆向量;基于第一概率和与真实样本对应的二值化逆向量,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率。
在一些实施例中,训练模块还用于确定与真实样本匹配的目标虚构类别;基于第一假设概率、以及目标虚构类别对应的虚构类别标签,确定真实样本对应于目标虚构类别的第一虚构损失。
在一些实施例中,训练模块还用于确定特征空间中与各虚构类别分别对应的第一代表特征,所述第一代表特征为当次训练中与各虚构类别对应的代表特征;分别确定真实样本的特征向量与各第一代表特征之间的距离;将距离中的最小值对应的第一代表特征所代表的虚构类别,作为与真实样本匹配的目标虚构类别。
在一些实施例中,训练模块还用于通过待训练的分类模型提取虚构样本的特征向量,并基于虚构样本的特征向量进行预测,得到虚构样本对应于所有类别的第二概率;确定用于构建虚构样本的至少一个真实样本,并基于与至少一个真实样本匹配的目标虚构类别,确定虚构样本对应的目标虚构类别;基于第二概率、以及虚构样本对应的目标虚构类别,确定虚构样本对应于目标虚构类别的第二原始损失;基于第二概率,确定虚构样本对应于除目标虚构类别以外的其他类别的第二假设概率;基于第二假设概率,确定虚构样本对应于所匹配的目标真实类别的第二虚构损失;基于第二原始损失和第二虚构损失,确定虚构样本对应于第二目标类别的第二损失。
在一些实施例中,训练模块还用于基于与虚构样本匹配的目标真实类别,确定与虚构样本对应的二值化向量;对与虚构样本对应的二值化向量进行逆运算,得到与虚构样本对应的二值化逆向量;基于第二概率和与虚构样本对应的二值化逆向量,确定真实样本对应于除目标真实类别以外的其他类别的第一假设概率。
在一些实施例中,训练模块还用于确定与虚构样本匹配的目标真实类别;基于第二假设概率、以及与目标真实类别对应的真实类别标签,确定虚构样本对应于目标真实类别的第二虚构损失。
在一些实施例中,训练模块还用于确定特征空间中与各真实类别分别对应的第二代表特征,所述第二代表特征为当次训练中与真实类别对应的代表特征;分别确定虚构样本的特征向量与各第二代表特征之间的距离;将各距离中的最小值对应的第二代表特征所代表的真实类别,作为与虚构样本匹配的目标真实类别。
在一些实施例中,分类模块还用于确定特征向量与各目标代表特征间的距离;将各距离中的最小值对应的目标代表特征所代表的虚构类别,作为与新增样本匹配的目标虚构类别。
在一些实施例中,上述装置还包括预测模块,用于获取待分类数据;将待分类数据输入至目标分类模型中,通过目标分类模型提取待分类数据的特征向量;基于待分类数据的特征向量,对待分类数据进行预测,以确定待分类数据所属的目标类别,目标类别为任一真实类别或任一新增类别。
上述分类模型的增量训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端或服务器。下面以计算机设备为服务器为例进行说明,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种分类模型的增量训练方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (16)
1.一种分类模型的增量训练方法,其特征在于,所述方法包括:
获取经真实样本和虚构样本共同训练得到的目标分类模型,所述目标分类模型支持对虚构类别和真实类别的预测;
获取新增样本,所述新增样本所属的新增类别不同于任一所述真实类别;
将所述新增样本输入至所述目标分类模型,并通过所述目标分类模型提取所述新增样本的特征向量;
确定特征空间中与各个虚构类别分别对应的目标代表特征,并基于所述特征向量与各目标代表特征间的差异,确定与所述新增样本匹配的目标虚构类别;
将所述目标虚构类别更新为所述新增类别,以使得所述目标分类模型支持对所述新增类别的预测。
2.根据权利要求1所述的方法,其特征在于,所述目标分类模型通过如下步骤训练得到:
获取真实样本和虚构样本,所述虚构样本是基于所述真实样本构建得到;
通过待训练的分类模型对所述真实样本进行预测,并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损失,所述第一目标类别包括所述真实样本所属的目标真实类别、和与所述真实样本匹配的目标虚构类别;
通过所述待训练的分类模型对所述虚构样本进行预测,并基于预测得到的第二输出确定所述虚构样本对应于第二目标类别的第二损失,所述第二目标类别包括分别与所述虚构样本匹配的目标真实类别和目标虚构类别;
基于所述第一损失和第二损失,构建目标损失函数,通过所述目标损失函数对所述待训练的分类模型进行迭代训练,直至达到训练停止条件时停止,得到训练完成的目标分类模型。
3.根据权利要求2所述的方法,其特征在于,所述通过所述目标损失函数对所述待训练的分类模型进行迭代训练,包括:
通过所述目标损失函数对所述待训练的分类模型进行多次迭代训练,并在每次迭代训练后,确定当次迭代训练对应的梯度,并基于所述梯度的反向传播,对特征空间中每个类别各自对应的代表特征进行更新;其中,最后一次迭代训练完成后所得到的每个类别各自对应的代表特征,为各个类别的目标代表特征。
4.根据权利要求2所述的方法,其特征在于,所述通过待训练的分类模型对所述真实样本进行预测,并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损失,包括:
通过待训练的分类模型提取所述真实样本的特征向量,并基于所述真实样本的特征向量进行预测,得到所述真实样本对应于所有类别的第一概率;
基于所述第一概率、以及所述真实样本所属的目标真实类别,确定所述真实样本对应于所述目标真实类别的第一原始损失;
基于所述第一概率,确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率;
基于所述第一假设概率,确定所述真实样本对应于所匹配的目标虚构类别的第一虚构损失;
基于所述第一原始损失和所述第一虚构损失,确定所述真实样本对应于第一目标类别的第一损失。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一概率,确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率,包括:
基于所述真实样本所属的目标真实类别,确定与所述真实样本对应的二值化向量,所述二值化向量的维度与预设类别的数量相匹配;
对与所述真实样本对应的二值化向量进行逆运算,得到与所述真实样本对应的二值化逆向量;
基于所述第一概率和与所述真实样本对应的所述二值化逆向量,确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率。
6.根据权利要求4所述的方法,其特征在于,所述基于所述第一假设概率,确定所述真实样本对应于所匹配的目标虚构类别的第一虚构损失,包括:
确定与所述真实样本匹配的目标虚构类别;
基于所述第一假设概率、以及所述目标虚构类别对应的虚构类别标签,确定所述真实样本对应于所述目标虚构类别的第一虚构损失。
7.根据权利要求6所述的方法,其特征在于,所述确定与所述真实样本匹配的目标虚构类别,包括:
确定特征空间中与各虚构类别分别对应的第一代表特征,所述第一代表特征为当次训练中与各虚构类别对应的代表特征;
分别确定所述真实样本的特征向量与各第一代表特征之间的距离;
将所述距离中的最小值对应的第一代表特征所代表的虚构类别,作为与所述真实样本匹配的目标虚构类别。
8.根据权利要求2所述的方法,其特征在于,所述通过所述待训练的分类模型对所述虚构样本进行预测,并基于预测得到的第二输出确定所述虚构样本对应于第二目标类别的第二损失,包括:
通过所述待训练的分类模型提取所述虚构样本的特征向量,并基于所述虚构样本的特征向量进行预测,得到所述虚构样本对应于所有类别的第二概率;
确定用于构建所述虚构样本的至少一个真实样本,并基于与所述至少一个真实样本匹配的目标虚构类别,确定所述虚构样本对应的目标虚构类别;
基于所述第二概率、以及所述虚构样本对应的目标虚构类别,确定所述虚构样本对应于所述目标虚构类别的第二原始损失;
基于所述第二概率,确定所述虚构样本对应于除所述目标虚构类别以外的其他类别的第二假设概率;
基于所述第二假设概率,确定所述虚构样本对应于所匹配的目标真实类别的第二虚构损失;
基于所述第二原始损失和所述第二虚构损失,确定所述虚构样本对应于第二目标类别的第二损失。
9.根据权利要求8所述的方法,其特征在于,所述基于所述第二概率,确定所述虚构样本对应于除所述目标虚构类别以外的其他类别的第二假设概率,包括:
基于与所述虚构样本匹配的目标真实类别,确定与所述虚构样本对应的二值化向量;
对与所述虚构样本对应的二值化向量进行逆运算,得到与所述虚构样本对应的二值化逆向量;
基于所述第二概率和与所述虚构样本对应的所述二值化逆向量,确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率。
10.根据权利要求8所述的方法,其特征在于,所述基于所述第二假设概率,确定所述虚构样本对应于所匹配的目标真实类别的第二虚构损失,包括:
确定与所述虚构样本匹配的目标真实类别;
基于所述第二假设概率、以及与所述目标真实类别对应的真实类别标签,确定所述虚构样本对应于所述目标真实类别的第二虚构损失。
11.根据权利要求9所述的方法,其特征在于,所述确定与所述虚构样本匹配的目标真实类别,包括:
确定特征空间中与各真实类别分别对应的第二代表特征,所述第二代表特征为当次训练中与真实类别对应的代表特征;
分别确定所述虚构样本的特征向量与各第二代表特征之间的距离;
将各距离中的最小值对应的第二代表特征所代表的真实类别,作为与所述虚构样本匹配的目标真实类别。
12.根据权利要求1所述的方法,其特征在于,所述基于所述特征向量与各目标代表特征间的差异,确定与所述新增样本匹配的目标虚构类别,包括:
确定所述特征向量与各目标代表特征间的距离;
将各距离中的最小值对应的目标代表特征所代表的虚构类别,作为与所述新增样本匹配的目标虚构类别。
13.根据权利要求1至11中任一项所述的方法,其特征在于,所述方法还包括:
获取待分类数据;
将所述待分类数据输入至所述目标分类模型中,通过所述目标分类模型提取所述待分类数据的特征向量;
基于所述待分类数据的特征向量,对所述待分类数据进行预测,以确定所述待分类数据所属的目标类别,所述目标类别为任一所述真实类别或任一所述新增类别。
14.一种分类模型的增量训练装置,其特征在于,所述装置包括:
模型模块,用于获取经真实样本和虚构样本共同训练得到的目标分类模型,所述目标分类模型支持对虚构类别和真实类别的预测;
获取模块,用于获取新增样本,所述新增样本所属的新增类别不同于任一所述真实类别;
输入模块,用于将所述新增样本输入至所述目标分类模型,并通过所述目标分类模型提取所述新增样本的特征向量;
分类模块,用于确定特征空间中与各个虚构类别分别对应的目标代表特征,并基于所述特征向量与各目标代表特征间的差异,确定与所述新增样本匹配的目标虚构类别;
更新模块,用于将所述目标虚构类别更新为所述新增类别,以使得所述目标分类模型支持对所述新增类别的预测。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211388547.4A CN115438755B (zh) | 2022-11-08 | 2022-11-08 | 分类模型的增量训练方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211388547.4A CN115438755B (zh) | 2022-11-08 | 2022-11-08 | 分类模型的增量训练方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115438755A true CN115438755A (zh) | 2022-12-06 |
CN115438755B CN115438755B (zh) | 2024-04-02 |
Family
ID=84252241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211388547.4A Active CN115438755B (zh) | 2022-11-08 | 2022-11-08 | 分类模型的增量训练方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115438755B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116306875A (zh) * | 2023-05-18 | 2023-06-23 | 成都理工大学 | 基于空间预学习与拟合的排水管网样本增量学习方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103489033A (zh) * | 2013-09-27 | 2014-01-01 | 南京理工大学 | 融合自组织映射与概率神经网络的增量式学习方法 |
US20160078320A1 (en) * | 2014-09-12 | 2016-03-17 | Disney Enterprises, Inc, | Incremental Category Embedding for Categorization |
CN110555390A (zh) * | 2019-08-09 | 2019-12-10 | 厦门市美亚柏科信息股份有限公司 | 基于半监督训练方式的行人重识别方法、装置及介质 |
CN110837856A (zh) * | 2019-10-31 | 2020-02-25 | 深圳市商汤科技有限公司 | 神经网络训练及目标检测方法、装置、设备和存储介质 |
US20200175384A1 (en) * | 2018-11-30 | 2020-06-04 | Samsung Electronics Co., Ltd. | System and method for incremental learning |
CN111931807A (zh) * | 2020-06-24 | 2020-11-13 | 浙江大学 | 一种基于特征空间组合的小样本类增量学习方法 |
CN113344144A (zh) * | 2021-07-29 | 2021-09-03 | 中国人民解放军国防科技大学 | 半监督的小样本类别增量学习方法、装置及分类识别方法 |
CN113673589A (zh) * | 2021-08-12 | 2021-11-19 | 南京理工大学 | 基于边框距离度量的标签选择自适应增量检测方法及系统 |
CN114065858A (zh) * | 2021-11-17 | 2022-02-18 | 上海高德威智能交通系统有限公司 | 一种模型训练方法、装置、电子设备及存储介质 |
US20220207410A1 (en) * | 2020-12-28 | 2022-06-30 | International Business Machines Corporation | Incremental learning without forgetting for classification and detection models |
CN114842398A (zh) * | 2022-05-23 | 2022-08-02 | 北京邮电大学 | 一种基于零样本学习的视频动作识别方法 |
CN114898154A (zh) * | 2022-05-16 | 2022-08-12 | 北京有竹居网络技术有限公司 | 一种增量式目标检测方法、装置、设备及介质 |
-
2022
- 2022-11-08 CN CN202211388547.4A patent/CN115438755B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103489033A (zh) * | 2013-09-27 | 2014-01-01 | 南京理工大学 | 融合自组织映射与概率神经网络的增量式学习方法 |
US20160078320A1 (en) * | 2014-09-12 | 2016-03-17 | Disney Enterprises, Inc, | Incremental Category Embedding for Categorization |
US20200175384A1 (en) * | 2018-11-30 | 2020-06-04 | Samsung Electronics Co., Ltd. | System and method for incremental learning |
CN110555390A (zh) * | 2019-08-09 | 2019-12-10 | 厦门市美亚柏科信息股份有限公司 | 基于半监督训练方式的行人重识别方法、装置及介质 |
CN110837856A (zh) * | 2019-10-31 | 2020-02-25 | 深圳市商汤科技有限公司 | 神经网络训练及目标检测方法、装置、设备和存储介质 |
CN111931807A (zh) * | 2020-06-24 | 2020-11-13 | 浙江大学 | 一种基于特征空间组合的小样本类增量学习方法 |
US20220207410A1 (en) * | 2020-12-28 | 2022-06-30 | International Business Machines Corporation | Incremental learning without forgetting for classification and detection models |
CN113344144A (zh) * | 2021-07-29 | 2021-09-03 | 中国人民解放军国防科技大学 | 半监督的小样本类别增量学习方法、装置及分类识别方法 |
CN113673589A (zh) * | 2021-08-12 | 2021-11-19 | 南京理工大学 | 基于边框距离度量的标签选择自适应增量检测方法及系统 |
CN114065858A (zh) * | 2021-11-17 | 2022-02-18 | 上海高德威智能交通系统有限公司 | 一种模型训练方法、装置、电子设备及存储介质 |
CN114898154A (zh) * | 2022-05-16 | 2022-08-12 | 北京有竹居网络技术有限公司 | 一种增量式目标检测方法、装置、设备及介质 |
CN114842398A (zh) * | 2022-05-23 | 2022-08-02 | 北京邮电大学 | 一种基于零样本学习的视频动作识别方法 |
Non-Patent Citations (1)
Title |
---|
李妍坊 等: "一种基于组合保留集的SVM增量学习算法", 上海交通大学学报, no. 07, 28 July 2016 (2016-07-28), pages 70 - 75 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116306875A (zh) * | 2023-05-18 | 2023-06-23 | 成都理工大学 | 基于空间预学习与拟合的排水管网样本增量学习方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115438755B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9990558B2 (en) | Generating image features based on robust feature-learning | |
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN111966914B (zh) | 基于人工智能的内容推荐方法、装置和计算机设备 | |
CN113688304A (zh) | 搜索推荐模型的训练方法、搜索结果排序的方法及装置 | |
CN112749608A (zh) | 视频审核方法、装置、计算机设备和存储介质 | |
CN113095346A (zh) | 数据标注的方法以及数据标注的装置 | |
US11423307B2 (en) | Taxonomy construction via graph-based cross-domain knowledge transfer | |
CN112528029A (zh) | 文本分类模型处理方法、装置、计算机设备及存储介质 | |
CN112966754B (zh) | 样本筛选方法、样本筛选装置及终端设备 | |
CN113011646A (zh) | 一种数据处理方法、设备以及可读存储介质 | |
CN113656699A (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN115879508A (zh) | 一种数据处理方法及相关装置 | |
CN115438755B (zh) | 分类模型的增量训练方法、装置和计算机设备 | |
CN113034168A (zh) | 内容项投放方法、装置、计算机设备及存储介质 | |
CN112989182B (zh) | 信息处理方法、装置、信息处理设备及存储介质 | |
CN111783688A (zh) | 一种基于卷积神经网络的遥感图像场景分类方法 | |
CN116522232A (zh) | 文档分类方法、装置、设备及存储介质 | |
CN116471281A (zh) | 一种考虑节点自私性的去中心化服务组合方法 | |
CN115757962A (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN117688390A (zh) | 内容匹配方法、装置、计算机设备、存储介质和程序产品 | |
CN116932862A (zh) | 冷启动对象推荐方法、装置、计算机设备和存储介质 | |
CN112116441A (zh) | 金融风险分类模型的训练方法、分类方法、装置及设备 | |
CN116910372B (zh) | 信息推送模型处理方法和装置、信息推送方法和装置 | |
CN117786234B (zh) | 一种基于两阶段对比学习的多模态资源推荐方法 | |
CN111931058B (zh) | 一种基于自适应网络深度的序列推荐方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |