CN112529183A - 一种基于知识蒸馏的模型自适应更新方法 - Google Patents
一种基于知识蒸馏的模型自适应更新方法 Download PDFInfo
- Publication number
- CN112529183A CN112529183A CN202110178302.8A CN202110178302A CN112529183A CN 112529183 A CN112529183 A CN 112529183A CN 202110178302 A CN202110178302 A CN 202110178302A CN 112529183 A CN112529183 A CN 112529183A
- Authority
- CN
- China
- Prior art keywords
- model
- distance
- samples
- time instant
- adaptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于知识蒸馏的模型自适应更新方法,本发明采用模型自适应更新方法,代替模型重训练过程,减少了计算资源和人力资源的投入;采用模型参数相似性约束,提炼旧模型中的知识,避免了模型更新中的灾难性遗忘现象,保持预测模型的稳定性;利用知识蒸馏的思想,构建实时预测的神经网络模型,使预测模型适应数据分布的变化,保证预测模型的可塑性,实现模型自适应更新中稳定性和可塑性的最佳权衡。相较于在线维护模型池,对新数据同时预测的方法,大大减少了模型实时预测需要的计算资源和内存资源。相较于直接利用新数据增量更新模型的方法,有效解决了模型更新中的灾难性遗忘现象。
Description
技术领域
本发明属于机器学习技术领域,具体地,涉及一种基于知识蒸馏的模型自适应更新方法。
背景技术
基于机器学习的数据自动预测方法的一个假设是:模型的训练数据和测试数据来自于同一个总体分布。然而,随着时间的推移,数据分布会发生变化。数据分布的变化可以进一步分为样本的变化和类别的变化。所谓样本的变化,是指样本在特征同构空间下的特征值的变化,以及每一类样本所占比例的可能变化。类别的变化是指新的类别的出现,即原来的分类发生了变化。所以,一段时间后,基于历史数据训练的模型可能不适用于一些新的数据。因此,有必要面向自动化预测系统的实际应用,实现模型的自适应更新,以保证不断变化的数据能够被正确预测。常用的模型自适应更新方法有模型重训练、不同时间窗口的模型集成和增量学习三种。
模型重训练需要消耗大量的计算资源和建模时间。不同时间窗口的模型集成需要维护一个模型池,对新数据同时进行打分,会消耗大量的计算资源。增量学习方法则存在灾难性遗忘现象,即随着时间的推移,模型使用最新的数据进行更新,新获得的数据往往会抹去之前学习到的模式;增量学习方法需要具备从新数据中持续学习的能力,同时保留以前学到的知识,是模型自适应更新中的稳定性-可塑性困境。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于知识蒸馏的模型自适应更新方法。
本发明的目的是通过以下技术方案来实现的:一种基于知识蒸馏的模型自适应更新方法,该方法包括以下步骤:
其中,为神经网络模型中的参数;为调整损失函数中和权重的系数,基于模型预测的软标签的信息熵确定;为调整
损失函数中权重的系数,基于数据集和的相似性确定;
为和之间的对数损失函数;为和之间的对数损失函数;为模型参数相似性约束项,以模型和中所有参数的距离进行
度量;
进一步地,所述步骤(3)中:
进一步地,所述步骤(3)中:
进一步地,所述步骤(4)中:
进一步地,所述步骤(4)中:
进一步地,所述步骤(4)中:
本发明的有益效果是:本发明采用模型自适应更新方法,代替模型重训练过程,减少了计算资源和人力资源的投入;采用模型参数相似性约束,提炼旧模型中的知识,避免了模型更新中的灾难性遗忘现象,保持预测模型的稳定性;利用知识蒸馏的思想,构建实时预测的神经网络模型,使预测模型适应数据分布的变化,保证预测模型的可塑性,实现模型自适应更新中稳定性和可塑性的最佳权衡。相较于在线维护模型池,对新数据同时预测的方法,大大减少了模型实时预测需要的计算资源和内存资源。相较于直接利用新数据增量更新模型的方法,有效解决了模型更新中的灾难性遗忘现象。
附图说明
图1为本发明基于知识蒸馏的模型自适应更新方法模型结构图;
图2为本发明基于知识蒸馏的模型自适应更新方法流程图;
图3为自适应更新模型结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
本发明中所述的知识蒸馏作为一种有效的模型压缩方法,利用一个小模型来模仿大模型(或模型集合)的预测能力,从而保留大模型学习到的知识。
如图1、2所示,本发明提出的一种基于知识蒸馏的模型自适应更新方法,包括以下步骤:
为数据集和之间的距离,为时刻的样本总量,分
别为中的第,个样本,分别为中的第p,q个样本,分别为中
的第p,q个样本;函数用于计算两个样本间的距离,可以采用曼哈顿距离、欧氏距离、
切比雪夫距离、余弦距离等;
为模型参数相似性约束项,控制模型参数在训练过程中的
更新幅度,以神经网络模型和中所有参数的距离进行度量,可以采用曼哈顿距
离、欧氏距离、切比雪夫距离、余弦距离等;优选地,本实施例采用欧氏距离进行度量,计算
公式如下:
本发明基于分类器预测的软标签的信息熵,确定样本真实标签和预测软标签在新模型损失函数中的权重;基于数据集的相似性,确定模型参数相似性约束项在新模型损失函数中的权重,保持预测模型的稳定性。
以下给出本发明的具体应用场景,但不限于此:
基于人工智能方法的结直肠癌预后风险预测模型的预测准确率超过了临床常用的结直肠癌分期系统。但是,真实临床场景中,随着时间的推移,人口统计、疾病流行、临床实践和医疗保健系统作为一个整体可能会发生变化,这意味着基于静态截面数据的模型可能会过时,导致预测结果不再准确。其次,模型应用于临床实践会改变结直肠癌临床决策和干预措施,导致新数据的结果分布和预测因子-结果关联关系变化,从而导致模型性能快速衰退。因此,结直肠癌风险特征随时间变化的特性会降低模型临床效用,有必要实现临床风险预测模型的自适应更新,以保证不断变化的数据能够被正确预测,从而保证模型的时效性。
在金融风控领域,由于风险防控方的防御措施会抵御部分恶性攻击事件,风险施加方会不断寻找系统漏洞而采取新的攻击方式,导致新的恶性事件发生等。这些真实场景中的特征变化特性,要求风险防控方用于风险防御的模型具有自适应更新的能力,保证模型可以持续发挥作用。
在推荐系统领域,随着用户行为在系统中的记录不断增多,用户会表现出明显的倾向性;同时,用户也容易受当下热点信息的影响而改变使用行为特征。这些都要求推荐系统可以适应系统特征的变化而自适应更新。
本发明提出的基于知识蒸馏的模型自适应更新方法,可以解决医疗、金融风控、推荐系统等领域的预测系统,随着时间的推移数据分布发生变化,导致不断变化的数据不能被正确预测的问题。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (9)
1.一种基于知识蒸馏的模型自适应更新方法,其特征在于,该方法包括以下步骤:
其中,为神经网络模型中的参数;为调整损失函数中和
权重的系数,基于模型预测的软标签的信息熵确定;为调整损失函数中权重的系数,基于数据集和的相似性确定;为和之间的对数损失函数;为和之间的对数损失函数;为模型参数相似性约束项,以模型和中所有参数的距离进行
度量;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110178302.8A CN112529183A (zh) | 2021-02-08 | 2021-02-08 | 一种基于知识蒸馏的模型自适应更新方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110178302.8A CN112529183A (zh) | 2021-02-08 | 2021-02-08 | 一种基于知识蒸馏的模型自适应更新方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112529183A true CN112529183A (zh) | 2021-03-19 |
Family
ID=74975541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110178302.8A Pending CN112529183A (zh) | 2021-02-08 | 2021-02-08 | 一种基于知识蒸馏的模型自适应更新方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112529183A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114817742A (zh) * | 2022-05-18 | 2022-07-29 | 平安科技(深圳)有限公司 | 基于知识蒸馏的推荐模型配置方法、装置、设备、介质 |
-
2021
- 2021-02-08 CN CN202110178302.8A patent/CN112529183A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114817742A (zh) * | 2022-05-18 | 2022-07-29 | 平安科技(深圳)有限公司 | 基于知识蒸馏的推荐模型配置方法、装置、设备、介质 |
CN114817742B (zh) * | 2022-05-18 | 2022-09-13 | 平安科技(深圳)有限公司 | 基于知识蒸馏的推荐模型配置方法、装置、设备、介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liang et al. | Adversarial deep reinforcement learning in portfolio management | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN109902222A (zh) | 一种推荐方法及装置 | |
CN106874581A (zh) | 一种基于bp神经网络模型的建筑空调能耗预测方法 | |
CN112085254B (zh) | 基于多重分形协同度量门控循环单元的预测方法及模型 | |
CN107563542A (zh) | 数据预测方法及装置和电子设备 | |
CN111680786B (zh) | 一种基于改进权重门控单元的时序预测方法 | |
CN113393057A (zh) | 一种基于深度融合机器学习模型的小麦产量集成预测方法 | |
CN110097929A (zh) | 一种高炉铁水硅含量在线预测方法 | |
CN115983438A (zh) | 数据中心末端空调系统运行策略确定方法及装置 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN116526473A (zh) | 基于粒子群优化lstm的电热负荷预测方法 | |
Strulik | Hyperbolic discounting and the time‐consistent solution of three canonical environmental problems | |
JPH04372046A (ja) | 需要量予測方法及び装置 | |
Chen | APSO-LSTM: an improved LSTM neural network model based on APSO algorithm | |
CN112529183A (zh) | 一种基于知识蒸馏的模型自适应更新方法 | |
CN113821903B (zh) | 温度控制方法和设备、模块化数据中心及存储介质 | |
CN114202065A (zh) | 一种基于增量式演化lstm的流数据预测方法及装置 | |
Chen et al. | Efficient approximate dynamic programming based on design and analysis of computer experiments for infinite-horizon optimization | |
CN108009859A (zh) | 农产品价格波动预警方法及设备 | |
CN113300884B (zh) | 一种基于gwo-svr的分步网络流量预测方法 | |
CN115221782A (zh) | 一种大型公共建筑能耗混合预测方法及系统 | |
CN114861555A (zh) | 一种基于Copula理论的区域综合能源系统短期负荷预测方法 | |
CN113627687A (zh) | 一种基于arima-lstm组合模型的供水量预测方法 | |
CN107273411A (zh) | 业务操作与数据库操作数据的关联方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210319 |
|
RJ01 | Rejection of invention patent application after publication |