CN114049162B

CN114049162B - 模型训练方法、需求量预测方法、装置、设备和存储介质

Info

Publication number: CN114049162B
Application number: CN202210024218.5A
Authority: CN
Inventors: 周鈵炎; 吴盛楠; 庄晓天
Original assignee: Beijing Jingdong Zhenshi Information Technology Co Ltd
Current assignee: Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date: 2022-01-11
Filing date: 2022-01-11
Publication date: 2022-12-27
Anticipated expiration: 2042-01-11
Also published as: CN114049162A

Abstract

本发明实施例公开了一种模型训练方法、需求量预测方法、装置、设备和存储介质，该模型训练方法包括：根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，预设物品为属性与目标物品的属性相同的物品；基于目标域样本集和辅助域样本集进行模型训练，得到多个中间模型，并基于多个中间模型构建模型池；对模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对目标物品进行需求量预测的目标模型，利用本发明实施例训练出的目标模型进行需求量预测，能够提高预测结果的准确度。

Description

模型训练方法、需求量预测方法、装置、设备和存储介质

技术领域

本发明实施例涉及计算机技术，尤其涉及一种模型训练方法、需求量预测方法、装置、设备和存储介质。

背景技术

在零售行业，通常需要对物品（例如商品）的需求量（例如销量）进行预测，常用的方法是收集样本，利用收集的样本进行模型训练，通过训练得到的模型对物品进行需求量预测，而训练出一个准确的模型通常需要依赖大量且准确的样本数据。

在实现本发明的过程中，发现人发现，针对有些物品例如汽车零件、奢侈品等，只能得到数量非常有限的样本数据，且样本数据表现非常稀疏，根据这种样本数据训练出的模型，预测准确度往往是达不到要求的。

发明内容

本发明实施例提供一种模型训练方法、需求量预测方法、装置、设备和存储介质，能够提高需求量预测结果的准确度。

第一方面，本发明实施例提供一种模型训练方法，包括：

根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，所述预设物品为属性与所述目标物品的属性相同的物品；

基于所述目标域样本集和所述辅助域样本集进行模型训练，得到多个中间模型，并基于所述多个中间模型构建模型池；

对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对所述目标物品进行需求量预测的目标模型。

可选地，所述目标物品的历史需求量特征数据包括所述目标物品的历史需求量和所述目标物品的历史需求量对应的实际需求量，所述预设物品的历史需求量特征数据包括所述预设物品的历史需求量和所述预设物品的历史需求量对应的实际需求量；

所述根据目标物品的历史需求量特征数据构建目标域样本集包括：以所述目标物品的历史需求量为样本，以所述目标物品的历史需求量对应的实际需求量为样本标签，构建所述目标域样本集；

所述根据预设物品的历史需求量特征数据构建辅助域样本集包括：以所述预设物品的历史需求量为样本，以所述预设物品的历史需求量对应的实际需求量为样本标签，构建所述辅助域样本集。

可选地，所述基于所述目标域样本集和所述辅助域样本集进行模型训练，得到多个中间模型，包括：

从所述目标域样本集和所述辅助域样本集中进行多轮采样，构建多个训练样本集，并基于所述多个训练样本集进行模型训练，得到所述多个中间模型。

可选地，所述从所述目标域样本集和所述辅助域样本集中进行多轮采样，构建多个训练样本集，并基于所述多个训练样本集进行模型训练，得到所述多个中间模型，包括：

获取所述目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重；

根据所述目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重从所述目标域样本集和所述辅助域样本集采集样本，得到训练样本集，并根据所述训练样本集进行模型训练，得到子模型；

确定所述子模型的学习误差；

根据所述子模型的学习误差调整所述目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重，并返回执行获取所述目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重，直至训练迭代次数达到预设迭代次数时得到预设数量的子模型，将所述预设数量的子模型组合得到一个中间模型；

按照得到上一个中间模型时所述目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重进行下一个中间模型的训练，直至得到所述多个中间模型。

可选地，所述确定所述子模型的学习误差，包括：

将所述目标域样本集中的每个样本和所述辅助域样本集中的每个样本输入所述子模型进行处理，得到所述目标域样本集中的每个样本对应的预测需求量和所述辅助域样本集中的每个样本对应的预测需求量；

根据所述目标域样本集中的每个样本对应的预测需求量和样本标签计算所述子模型对所述目标域样本集中的每个样本的学习误差，并根据所述辅助域样本集中的每个样本对应的预测需求量和样本标签计算所述子模型对所述辅助域样本集中的每个样本的学习误差。

可选地，所述根据所述子模型的学习误差调整所述目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重，包括：

根据所述子模型对所述目标域样本集中的每个样本的学习误差加大所述目标域样本集中的对应样本的当前采样权重，其中，学习误差越大，对应样本的当前采样权重加大的越多；

根据所述子模型对所述辅助域样本集中的每个样本的学习误差降低所述辅助域样本集中的对应样本的当前采样权重，其中，学习误差越大，对应样本的当前采样权重降低的越多。

可选地，所述调整所述辅助域样本集中的每个样本的当前采样权重，包括：

按照预设函数降低所述辅助域样本集中的每个样本的当前采样权重，所述预设函数如下：

其中，n表示训练第n个子模型，n为大于2的整数，e表示自然对数的底数，sp表示所述预设迭代次数，Y（n）训练第n个子模型时的采样权重衰减系数。

可选地，所述对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于进行需求量预测的目标模型，包括：

基于元学习方法对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，根据学习结果和当前需求量特征数据生成新的模型，将所述新的模型确定为所述目标模型。

基于元学习方法对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，根据学习结果和当前需求量特征数据从所述多个中间模型中选择一个中间模型作为所述目标模型。

第二方面，本发明实施例提供一种需求量预测方法，包括：

获取目标物品的当前需求量特征数据；

利用如本发明实施例任一项所述的模型训练方法训练得到的目标模型处理所述当前需求量特征数据，得到所述目标物品的预测需求量。

第三方面，本发明实施例提供一种模型训练装置，包括：

构建模块，用于根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，所述预设物品为属性与所述目标物品的属性相同的物品；

训练模块，用于基于所述目标域样本集和所述辅助域样本集进行模型训练，得到多个中间模型，并基于所述多个中间模型构建模型池；

学习模块，用于对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对所述目标物品进行需求量预测的目标模型。

第四方面，本发明实施例提供一种需求量预测装置，包括：

获取模块，用于获取目标物品的当前需求量特征数据；

预测模块，用于利用如本发明实施例任一项所述的模型训练方法训练得到的目标模型处理所述当前需求量特征数据，得到所述目标物品的预测需求量。

第五方面，本发明实施例提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明实施例任一所述的模型训练方法，或者所述处理器执行所述程序时实现如本发明实施例所述的需求量预测方法。

第六方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例任一所述的模型训练方法，或者该程序被处理器执行时实现如本发明实施例所述的需求量预测方法。

本发明实施例中，可以根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，预设物品为属性与目标物品的属性相同的物品；基于目标域样本集和辅助域样本集进行模型训练，得到多个中间模型，并基于多个中间模型构建模型池；对模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对目标物品进行需求量预测的目标模型。本发明实施例中，将迁移学习的思想应用在物品需求量预测场景，将属性与目标物品的属性相同的物品的样本数据（即辅助域样本集）迁移用于目标物品的需求量预测模型的训练，即将属性与目标物品的属性相同的物品的样本数据与目标物品的样本数据（即目标域样本集）相结合进行模型训练，从而得到用于预测目标物品的需求量的模型（即目标模型），解决了目标物品的样本数据量少且稀疏导致的模型预测准确度低的问题，提高了需求量预测结果的准确度。

进一步地，训练出多个中间模型并学习模型训练过程（即对模型池中的中间模型和每个中间模型对应的训练样本集进行学习），从而得到目标模型，利用目标模型预测目标物品的需求量，可以避免直接利用迁移学习得到的一个中间模型进行预测导致的局部大误差的产生，进一步提高了预测结果的准确度。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明实施例提供的模型训练方法的一个流程示意图；

图2是本发明实施例提供的模型池的构建方法的一个流程示意图；

图3是本发明实施例提供的需求量预测方法的一个流程示意图；

图4是本发明实施例提供的模型训练装置的一个结构示意图；

图5是本发明实施例提供的需求量预测装置的一个结构示意图；

图6是本发明实施例提供的电子设备的一个结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

由于目前利用数量有限、表现稀疏的样本数据训练出的模型，预测准确度达不到要求，而在实现本发明的过程中，发明人还发现，迁移学习（Transfer Learning）是一种机器学习方法，是把一个领域（比如源领域）的知识，迁移到另外一个领域（比如目标领域），使得目标领域能够取得更好的学习效果。通常，做迁移学习时，源领域数据量充足，而目标领域数据量较小。但是，目前还没有将迁移学习用于物品需求量预测场景的；且目前在其他场景做迁移学习时，通常只是利用迁移学习法训练出一个中间模型，利用这一个中间模型进行数据处理，容易产生局部大误差，数据处理的准确度不够。针对这些问题，本发明实施例提供了相应的解决方案。

图1为本发明实施例提供的模型训练方法的一个流程示意图，该方法可以由本发明实施例提供的模型训练装置来执行，该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中，该装置可以集成在电子设备中，电子设备比如可以是计算机、服务器。以下实施例将以该装置集成在电子设备中为例进行说明，参考图1，该方法具体可以包括如下步骤：

步骤101，根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，预设物品为属性与目标物品的属性相同的物品。

示例地，目标物品可以是需要进行需求量预测的物品，但是由于目标物品具有的一些特性导致目标物品的样本数据量少且分布稀疏。比如，目标物品可以为奢侈品、价格相对很高的物品等，目标物品的销售频率很低且不规律，导致目标物品的销售数据的量级很小，甚至于连续的十几天内都不会有一单销售数据产生。以目标物品为某奢侈品为例，可能在很长的一个时间周期内，目标物品只是在不固定的几个时间点上有销量数据，销量数据少且分布稀疏。示例地，目标物品在某个时间周期内的销量数据比如下表1所示：

物品编码	日期	历史销量
			SKU001	2019-3-14	46
SKU001	2019-4-19	7
			SKU001	2019-6-20	50
SKU001	2019-10-21	60
			SKU001	2020-1-23	65
SKU001	2020-3-27	30
			……	……	……
SKU001	2020-5-12	28

表1

从表1可以看出，从2019-3-14至2020-5-12，目标物品只是在不固定的几个时间点上有销量数据，如果仅以这种数据作为样本数据进行模型训练，训练出的模型的预测准确度是不够的，如果将这种预测准确度不够的模型投入实际应用，由于供应链存在牛鞭效应（Bullwhip Effect），误差将会在上下游逐渐放大，带来很大的成本消耗。实际训练过程中，我们希望的样本数据是在一个时间周期内的每个时间点上都有销量数据，即销量数据是大量、连续分布的。

为了解决这种量少、且分布稀疏的样本数据导致的模型预测准确度不够的问题，本发明实施例中，基于迁移学习的思想，在训练用于预测目标物品的模型时，引入与目标物品具有相同属性的预设物品的样本数据，即将预设物品的样本数据迁移过来用于目标物品的模型训练。本发明实施例的属性可以是类型、品牌、应用领域等。预设物品可以是样本数据多、且样本数据分布连续的物品。比如，目标物品是某奢侈品牌的女包，预设物品可以是一些平价品牌的女包；再比如，目标物品为某品牌的高端汽车，预设物品可以为该品牌的经济型汽车。相比目标物品来说，预设物品销售的频率更高，销售数据量大且连续。以库存量单位（Stock Keeping Unit，SKU）标识目标物品，则预设物品可以包括一个或多个SKU与目标物品的SKU不同的物品。

示例地，目标物品的历史需求量特征数据可以包括目标物品的历史需求量和目标物品的历史需求量对应的实际需求量，目标物品的历史需求量可以是在过去的第一预设时间段内的目标物品的实际销量，目标物品的历史需求量对应的实际需求量可以是在过去的第二预设时间段内的目标物品的实际销量。预设物品的历史需求量特征数据可以包括预设物品的历史需求量和预设物品的历史需求量对应的实际需求量，预设物品的历史需求量可以是在过去的第一预设时间段内的预设物品的实际销量，预设物品的历史需求量对应的实际需求量可以是在过去的第二预设时间段内的预设物品的实际销量。其中，第二预设时间段晚于第一预设时间段。示例地，比如第一预设时间段为2019-1-1至2019-4-1，第二预设时间段为2019-4-1至2019-7-1。

具体地，在构建目标域样本集时，可以以目标物品的历史需求量为样本，以目标物品的历史需求量对应的实际需求量为样本标签，所构建的目标域样本集中可以包括多个样本。在构建辅助域样本集时，可以以预设物品的历史需求量为样本，以预设物品的历史需求量对应的实际需求量为样本标签，所构建的辅助域样本集中可以包括多个样本。一般来说，辅助域样本集中的样本数量会远多于目标域样本集中的样本数量。

步骤102，基于目标域样本集和辅助域样本集进行模型训练，得到多个中间模型，并基于多个中间模型构建模型池。

示例地，可以按照一定的采样规则从目标域样本集和辅助域样本集进行多轮采样，每轮采样构建一个训练样本集，多轮采样就构建多个训练样本集，每个训练样本集中包括的样本不同，基于构建的训练样本集进行模型训练，得到多个中间模型。

具体地，在训练过程中，每训练得到一个中间模型，可以将该中间模型添加到模型池，然后继续下一个中间模型的训练，直至添加至模型池的所有模型达到模型池的容量限制时停止训练。

步骤103，对模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对目标物品进行需求量预测的目标模型。

示例地，可以基于元学习方法对多个中间模型中的每个中间模型和每个中间模型对应的训练样本集进行学习，得到目标模型。

元学习（Meta Learning），或者叫做“学会学习”（Learning to learn），它是要“学会如何学习”，即利用以往的知识经验来指导新任务的学习，具有学会学习的能力。本发明实施例中，在训练得到多个中间模型之后，可以基于元学习方法对多个中间模型中的每个中间模型和每个中间模型对应的训练样本集进行学习，从而学习到模型的训练过程，基于学习到模型的训练过程得到目标模型。

示例地，在做元学习时，可以采用轻量的梯度提升机（Light Gradient BoostingMachine，LightGBM）算法，LightGBM算法的特征抽样方法和数据采样方法可以在保证模型准确度的情况下，极大地降低元学习的计算时间，比较适合本发明实施例的应用场景。

具体地，在基于元学习方法学习得到目标模型时，可以根据学习结果和目标物品的当前需求量特征数据从多个中间模型中选择一个中间模型作为目标模型。即通过学习到的训练方法，从多个中间模型中选择出最适合处理中间模型。其中，当前需求量特征数据可以是近期某段时间内目标物品的销量特征数据，该销量特征数据中比如可以包括从过去的某个时间到当前时间目标物品的销量（即当前销量），本发明实施例即要利用目标物品的当前销量预测目标物品在未来一段时间的销量。

具体地，在基于元学习方法学习得到目标模型时，还可以基于元学习方法对每个中间模型和每个中间模型对应的训练样本集进行学习，根据学习结果和目标物品的当前需求量特征数据生成新的模型，将新的模型作为目标模型。即通过学习到的训练方法，重新生成一个模型。

在一个具体的实施例中，在得到目标模型之后，还可以获取目标物品的当前需求量特征数据，利用目标模型处理当前需求量特征数据，得到目标物品的预测需求量。

示例地，可以基于当前需求量对应的预测需求量优化供应链资源分配和安排，以降低供应链上下游的成本，减少物品在仓库的平均储存时长，提升仓库的周转效率。

在一个具体的实施例中，本发明实施例提供的模型池可按照图2所示方法得到，即图1中的步骤102具体可以包括如下步骤：

步骤1021，获取目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重。

具体地，目标域样本集是根据目标物品的历史需求量特征数据建立的，目标物品的历史需求量特征数据可以包括目标物品的历史需求量和目标物品的历史需求量对应的实际需求量，目标物品的历史需求量可以是在过去的第一预设时间段内的目标物品的实际销量，目标物品的历史需求量对应的实际需求量可以是在过去的第二预设时间段内的目标物品的实际销量。其中，第二预设时间段晚于第一预设时间段。示例地，可以以目标物品的历史需求量为样本，以目标物品的历史需求量对应的实际需求量为样本标签，构建目标域样本集。所构建的目标域样本集中可以包括多个样本，这些样本的分布可能是稀疏的，即有些时间点有对应的样本，有些时间点可能没有对应的样本。

具体地，辅助域样本集是根据预设物品的历史需求量特征数据建立的，预设物品的历史需求量特征数据可以包括预设物品的历史需求量和预设物品的历史需求量对应的实际需求量，预设物品的历史需求量可以是在过去的第一预设时间段内的预设物品的实际销量，预设物品的历史需求量对应的实际需求量可以是在过去的第二预设时间段内的预设物品的实际销量。其中，第二预设时间段晚于第一预设时间段。示例地，可以以预设物品的历史需求量为样本，以预设物品的历史需求量对应的实际需求量为样本标签，构建辅助域样本集。所构建的辅助域样本集中可以包括多个样本，辅助域样本集中的样本数量会远多于目标域样本集中的样本数量，且辅助域样本集中的样本分布通常是连续的。

示例地，在步骤1021，可以获取为目标域样本集中的每个样本和辅助域样本集中的每个样本设置的初始采样权重，采样权重可以理解为样本被采集到的概率，初始时目标域样本集中的每个样本和辅助域样本集中的每个样本被采集到的概率相同，即两个样本集中的样本的初始采样权重可以相同。

步骤1022，根据目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重从目标域样本集和辅助域样本集采集样本，得到训练样本集，并根据训练样本集进行模型训练，得到子模型。

示例地，训练样本集中也包括多个样本，训练样本集中的具体样本数量可视实际需求设置，比如可以依据设备的计算能力、模型的准确度要求等设置。

步骤1023，确定子模型的学习误差。

具体地，可以将目标域样本集中的每个样本输入子模型进行处理，得到目标域样本集中的每个样本对应的预测需求量，根据目标域样本集中的每个样本对应的预测需求量和样本标签计算子模型对目标域样本集中的每个样本的学习误差。

其中，目标域样本集中的每个样本对应的预测需求量可以是目标物品的历史需求量对应的预测需求量，该预测需求量可以理解为利用子模型对目标物品的历史需求量进行学习，从而得到的预测需求量，该预测需求量可以是在过去的第二预设时间段内的目标物品的实际销量。比如，可以将在过去的第一预设时间段内的目标物品的实际销量（即历史需求量）输入子模型进行预测处理，得到在过去的第二预设时间段内的目标物品的预测销量（即预测需求量）。另外，目标物品还具有在过去的第二预设时间段内的实际销量（即实际需求量），根据目标物品在过去的第二预设时间段内的实际销量和预测销量即可确定子模型对目标物品的销量预测的学习误差，也即目标域样本集中的每个样本的学习误差。

其中，辅助域样本集中的每个样本对应的预测需求量可以是预设物品的历史需求量对应的预测需求量，该预测需求量可以理解为利用子模型对预设物品的历史需求量进行学习，从而得到的预测需求量，该预测需求量可以是在过去的第二预设时间段内的预设物品的实际销量。比如，可以将在过去的第一预设时间段内的预设物品的实际销量（即历史需求量）输入子模型进行预测处理，得到在过去的第二预设时间段内的预设物品的预测销量（即预测需求量）。另外，预设物品还具有在过去的第二预设时间段内的实际销量（即实际需求量），根据预设物品在过去的第二预设时间段内的实际销量和预测销量即可确定子模型对预设物品的销量预测的学习误差，也即辅助域样本集中的每个样本的学习误差。

步骤1024，根据子模型的学习误差调整目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重。

比如，可以根据子模型对目标域样本集中的每个样本的学习误差加大目标域样本集中的对应样本的当前采样权重，其中，学习误差越大，对应样本的当前采样权重加大的越多；根据子模型对辅助域样本集中的每个样本的学习误差降低辅助域样本集中的对应样本的当前采样权重，其中，学习误差越大，对应样本的当前采样权重降低的越多。

另外，在对辅助域样本集中的每个样本的当前采样权重进行调整时，还可以按照预设函数降低辅助域样本集中的每个样本的当前采样权重，预设函数可以为指数函数，比如可以如下：

其中，n表示训练第n个子模型，n为大于2的整数（因为训练第一个子模型时采用初始设置的采样权重，训练第二个子模型时才需要进行采样权重的调整），e表示自然对数的底数，sp表示所述预设迭代次数，Y（n）训练第n个子模型时的采样权重衰减系数。

可以理解为，针对目标域样本集中的每个样本，在迭代训练的过程中，逐步给与更高的关注，学习误差越大，给与关注的程度越高；针对辅助域样本集中的每个样本，在迭代训练的过程中，逐步降低给与的关注，学习误差越大，降低关注的幅度越大。通过对两个集合中的样本的采样权重不断地进行调整，不断地重新采样达到对数据筛选的效果，从而选出更有用、拟合效果更好的数据，避免由于目标域样本集和辅助域样本集中的样本数量差距过大，导致的子模型的训练严重受到辅助域样本集的影响，导致子模型的学习误差极大，起到减小子模型的学习误差的作用。

步骤1025，确定训练迭代次数是否达到预设迭代次数，若达到预设迭代次数，则执行步骤1026，若没有达到预设迭代次数，则返回步骤1021。

具体地，预设迭代次数可根据实际需求进行设置，比如可以根据设备的运算能力、模型的训练速度、要求的模型预测准确率等进行设置。

步骤1026，将预设数量的子模型组合得到一个中间模型。

步骤1027，按照得到上一个中间模型时目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重进行下一个中间模型的训练，直至得到多个中间模型。

步骤1028，基于多个中间模型构建模型池。

由于迭代训练的过程中，会不断地调整目标域样本集中的每个样本的采样权重和辅助域样本集中的每个样本的采样权重，在进行下一个中间模型的训练时，可以直接从得到上一个中间模型时目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重开始，以提高训练速度和训练得到的模型的预测准确度。

示例地，本发明实施例中的子模型可以是弱学习器，中间模型可以是强学习器，对应地，目标模型也是强学习器，目标模型可以理解为改进的TrAdaBoostR2模型（即TrAdaboostR2_pro）。

传统的TrAdaBoostR2模型在模型训练迭代阶段，只是调整辅助域样本集中的每个样本的采样权重，对目标域样本集中的每个样本的采样权重则不调整，在目标域样本集和辅助域样本集中的样本数量差距过大时，子模型受辅助域样本集影响较大，容易导致模型预测误差较大。而改进的TrAdaBoostR2模型在模型训练迭代阶段，会不断地调整目标域样本集中的每个样本的采样权重和辅助域样本集中的每个样本的采样权重，通过不断减小辅助域样本集中的每个样本的采样权重、不断增加目标域样本集中的每个样本的采样权重，从而降低由于两个样本集中样本数量差异较大导致的模型预测误差。

示例地，以均方误差（Mean Square Error，MSE）和对称平均绝对百分比误差（Symmetric Mean Absolute Percentage Error，SMAPE）来衡量模型预测误差，在改进的TrAdaBoostR2模型的迭代训练中，依次产生了如下两组数据：

第一组：

TrAdaboostR2_pro的MSE: 1.5482663648664627；

TrAdaboostR2_pro的SMAPE: 1.0036462821257373；

第二组：

TrAdaboostR2_pro的MSE: 1.5427430427519053；

TrAdaboostR2_pro的SMAPE: 1.0027956375781746。

通过对比这两组数据可以看出，随着迭代训练，模型的MSE和SMAPE这两项误差均在降低。

下面结合模型训练过程说明本发明实施例提供的需求量预测方法，请参阅图3，具体如下：

步骤201，构建目标域样本集和辅助域样本集。

即根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，预设物品为属性与目标物品的属性相同的物品；目标域样本集中的样本是目标物品的历史需求量，目标域样本集中的样本标签是目标物品的历史需求量对应的实际需求量；辅助域样本集中的样本是预设物品的历史需求量，辅助域样本集中的样本标签是预设物品的历史需求量对应的实际需求量。

步骤202，预处理。

在预处理阶段，可以为目标域样本集中的每个样本和辅助域样本集中的每个样本设置采样权重，此时为目标域样本集中的每个样本和辅助域样本集中的每个样本设置的采样权重可以相同，比如均为1。采样权重可以理解为采样概率。

步骤203，训练子模型。

即根据目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重从目标域样本集和辅助域样本集采集样本，得到训练样本集，并根据训练样本集进行模型训练，得到子模型。

步骤204，确定是否达到预设迭代次数，若达到，则执行步骤206；若没有达到，则执行步骤205。

步骤205，调整两个样本集的样本的采样权重。

具体地，可以将目标域样本集中的每个样本和辅助域样本集中的每个样本输入当前训练得到的子模型进行处理，得到目标域样本集中的每个样本对应的预测需求量和辅助域样本集中的每个样本对应的预测需求量；根据目标域样本集中的每个样本对应的预测需求量和样本标签计算该当前的学习器对目标域样本集中的每个样本的学习误差，并根据辅助域样本集中的每个样本对应的预测需求量和样本标签计算当前的子模型对辅助域样本集中的每个样本的学习误差。

根据当前的子模型对目标域样本集中的每个样本的学习误差加大目标域样本集中的对应样本的当前采样权重，其中，学习误差越大，对应样本的当前采样权重加大的越多；根据当前的子模型对辅助域样本集中的每个样本的学习误差降低辅助域样本集中的对应样本的当前采样权重，其中，学习误差越大，对应样本的当前采样权重降低的越多。将采样权重调整之后的目标域样本集和辅助域样本集用于下一个子模型的迭代训练。

另外，针对辅助域样本集中的样本的采样权重的调整，还可以不依据当前的子模型的学习误差，而直接采用指数函数进行调整，指数函数可参阅前面实施例的描述，此处不再赘述。

步骤206，组合子模型得到中间模型。

步骤207，将中间模型添加至模型池。

如果添加之后，模型池仍有剩余容量/空间，则返回步骤303，继续进行下一个中间模型的训练，在训练下一个中间模型时，从得到上一个中间模型时目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重开始，而并非从初始设置的权重开始，以提高训练速度和训练得到的模型的准确度。

步骤208，基于元学习学习训练过程。

即基于元学习方法对多个中间模型中的每个中间模型和每个中间模型对应的训练样本集进行学习，从而学会训练过程。

步骤209，得到目标模型。

示例地，可以根据学习结果和目标物品的当前需求量特征数据从多个中间模型中选择一个中间模型作为目标模型。即通过学习到的训练方法，从多个中间模型中选择出最适合处理目标物品的当前需求量特征数据的中间模型。

示例地，还可以基于元学习方法对每个中间模型和每个中间模型对应的训练样本集进行学习，根据学习结果和目标物品的当前需求量特征数据生成一个新的模型，从而得到目标模型。即通过学习到的训练方法，重新生成一个中间模型，用于对当前需求量特征数据进行处理。

步骤210，利用目标模型对当前需求量特征数据进行预测处理，得到目标物品的预测需求量。

本发明实施例中，将迁移学习的思想应用在物品需求量预测场景，将属性与目标物品的属性相同的物品的样本数据（即辅助域样本集）迁移用于目标物品的需求量预测模型的训练，即将属性与目标物品的属性相同的物品的样本数据与目标物品的样本数据（即目标域样本集）相结合进行模型训练，从而得到用于预测目标物品的需求量的模型（即学习器），解决了目标物品的样本数据量少且稀疏导致的模型预测准确度低的问题，提高了预测结果的准确度。

进一步地，基于迁移学习训练出多个中间模型，再基于元学习的思想学习模型训练过程（即对多个中间模型及每个中间模型对应的训练样本集进行学习），从而得到适用于处理目标物品的当前需求量特征数据的目标模型，利用目标模型预测目标物品的需求量，可以避免直接利用迁移学习得到的一个中间模型进行预测导致的局部大误差的产生，进一步提高了预测结果的准确度。

此外，在训练的过程中，通过对两个集合中的样本的采样权重不断地进行调整，不断地重新采样达到对数据筛选的效果，从而选出更有用、拟合效果更好的数据，避免由于目标域样本集和辅助域样本集中的样本数量差距过大，导致的子模型的训练严重受到辅助域样本集的影响，导致子模型的学习误差极大，起到减小子模型的学习误差的作用，最终提高了目标模型的预测准确度。

图4是本发明实施例提供的模型训练装置的一个结构图，该装置适用于执行本发明实施例提供的模型训练方法。如图4所示，该装置具体可以包括：

构建模块301，用于根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，预设物品为属性与目标物品的属性相同的物品；

训练模块302，用于基于目标域样本集和辅助域样本集进行模型训练，得到多个中间模型，并基于多个中间模型构建模型池；

学习模块303，用于对模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对目标物品进行需求量预测的目标模型。

一实施例中，目标物品的历史需求量特征数据包括目标物品的历史需求量和目标物品的历史需求量对应的实际需求量，预设物品的历史需求量特征数据包括预设物品的历史需求量和预设物品的历史需求量对应的实际需求量；

构建模块301根据目标物品的历史需求量特征数据构建目标域样本集包括：以目标物品的历史需求量为样本，以目标物品的历史需求量对应的实际需求量为样本标签，构建目标域样本集；

构建模块301根据预设物品的历史需求量特征数据构建辅助域样本集包括：以预设物品的历史需求量为样本，以预设物品的历史需求量对应的实际需求量为样本标签，构建辅助域样本集。

一实施例中，训练模块302具体用于：

从目标域样本集和所述辅助域样本集中进行多轮采样，构建多个训练样本集，并基于多个训练样本集进行模型训练，得到多个中间模型。

一实施例中，训练模块302具体用于：

获取目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重；

根据目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重从目标域样本集和辅助域样本集采集样本，得到训练样本集，并根据训练样本集进行模型训练，得到子模型；

确定子模型的学习误差；

根据子模型的学习误差调整目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重，并返回执行获取目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重，直至训练迭代次数达到预设迭代次数时得到预设数量的子模型，将预设数量的子模型组合得到一个中间模型；

按照得到上一个中间模型时目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重进行下一个中间模型的训练，直至得到多个中间模型。

一实施例中，训练模块302确定子模型的学习误差，包括：

将目标域样本集中的每个样本和辅助域样本集中的每个样本输入子模型进行处理，得到目标域样本集中的每个样本对应的预测需求量和辅助域样本集中的每个样本对应的预测需求量；

根据目标域样本集中的每个样本对应的预测需求量和样本标签计算子模型对目标域样本集中的每个样本的学习误差，并根据辅助域样本集中的每个样本对应的预测需求量和样本标签计算子模型对所述辅助域样本集中的每个样本的学习误差。

一实施例中，训练模块302根据子模型的学习误差调整目标域样本集中的每个样本的当前采样权重和辅助域样本集中的每个样本的当前采样权重，包括：

根据子模型对所述目标域样本集中的每个样本的学习误差加大目标域样本集中的对应样本的当前采样权重，其中，学习误差越大，对应样本的当前采样权重加大的越多；

根据子模型对辅助域样本集中的每个样本的学习误差降低辅助域样本集中的对应样本的当前采样权重，其中，学习误差越大，对应样本的当前采样权重降低的越多。

一实施例中，训练模块302调整辅助域样本集中的每个样本的当前采样权重，包括：

按照预设函数降低所述辅助域样本集中的每个样本的当前采样权重，预设函数如下：

一实施例中，学习模块303具体用于：

基于元学习方法对模型池中的中间模型和每个中间模型对应的训练样本集进行学习，根据学习结果和当前需求量特征数据生成新的模型，将新的模型确定为目标模型。

一实施例中，学习模块303具体用于：

基于元学习方法对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，根据学习结果和当前需求量特征数据从所述多个中间模型中选择一个中间模型作为目标模型。

本领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述功能模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本发明实施例的装置，将迁移学习的思想应用在物品需求量预测场景，将属性与目标物品的属性相同的物品的样本数据（即辅助域样本集）迁移用于目标物品的需求量预测模型的训练，即将属性与目标物品的属性相同的物品的样本数据与目标物品的样本数据（即目标域样本集）相结合进行模型训练，从而得到用于预测目标物品的需求量的模型（即目标模型），解决了目标物品的样本数据量少且稀疏导致的模型预测准确度低的问题，提高了需求量预测结果的准确度。

图5是本发明实施例提供的需求量预测装置的一个结构图，该装置适用于执行本发明实施例提供的需求量预测方法。如图5所示，该装置具体可以包括：

获取模块401，用于获取目标物品的当前需求量特征数据；

预测模块402，用于利用如本发明实施例任一项的模型训练方法训练得到的目标模型处理当前需求量特征数据，得到目标物品的预测需求量。

本发明实施例还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行所述程序时实现上述任一实施例提供的模型训练方法，或者处理器执行所述程序时实现上述任一实施例提供的需求量预测方法。

本发明实施例还提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一实施例提供的模型训练方法，或者该程序被处理器执行时实现上述任一实施例提供的需求量预测方法。

下面参考图6，其示出了适于用来实现本发明实施例的电子设备的计算机系统500的结构示意图。图6示出的电子设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块和/或单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块和/或单元也可以设置在处理器中，例如，可以描述为：一种处理器包括构建模块、训练模块和学习模块；或者可以描述为：一种处理器包括获取模块和预测模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，预设物品为属性与目标物品的属性相同的物品；基于目标域样本集和辅助域样本集进行模型训练，得到多个中间模型，并基于多个中间模型构建模型池；对模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对目标物品进行需求量预测的目标模型。

或者，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：获取目标物品的当前需求量特征数据；利用如本发明实施例任一项所述的模型训练方法训练得到的目标模型处理当前需求量特征数据，得到目标物品的预测需求量。

根据本发明实施例的技术方案，将迁移学习的思想应用在物品需求量预测场景，将属性与目标物品的属性相同的物品的样本数据（即辅助域样本集）迁移用于目标物品的需求量预测模型的训练，即将属性与目标物品的属性相同的物品的样本数据与目标物品的样本数据（即目标域样本集）相结合进行模型训练，从而得到用于预测目标物品的需求量的模型（即目标模型），解决了目标物品的样本数据量少且稀疏导致的模型预测准确度低的问题，提高了需求量预测结果的准确度。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种模型训练方法，其特征在于，包括：

根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，所述预设物品为属性与所述目标物品的属性相同的物品；其中，所构建的目标域样本集中包括多个样本，且目标域样本集中样本的分布是稀疏的，所述稀疏是指有些时间点有对应的样本，有些时间点没有对应的样本；所构建的辅助域样本集中包括多个样本，辅助域样本集中的样本数量多于目标域样本集中的样本数量；目标物品的样本数据量少且分布稀疏是由目标物品具有的特性导致的；

对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对所述目标物品进行需求量预测的目标模型；

所述对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对所述目标物品进行需求量预测的目标模型，包括：

基于元学习方法对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，根据学习结果和当前需求量特征数据生成新的模型，将所述新的模型确定为所述目标模型；或者，

基于元学习方法对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，根据学习结果和当前需求量特征数据从所述多个中间模型中选择一个中间模型作为所述目标模型；

所述目标物品的历史需求量特征数据包括所述目标物品的历史需求量和所述目标物品的历史需求量对应的实际需求量，所述预设物品的历史需求量特征数据包括所述预设物品的历史需求量和所述预设物品的历史需求量对应的实际需求量；其中，所述目标物品的历史需求量是第一预设时间段内的所述目标物品的实际销量，所述目标物品的历史需求量对应的实际需求量是第二预设时间段内的所述目标物品的实际销量；所述预设物品的历史需求量是第一预设时间段内的所述预设物品的实际销量，所述预设物品的历史需求量对应的实际需求量是第二预设时间段内的所述预设物品的实际销量；第二预设时间段晚于第一预设时间段；

2.根据权利要求1所述的模型训练方法，其特征在于，所述基于所述目标域样本集和所述辅助域样本集进行模型训练，得到多个中间模型，包括：

3.根据权利要求2所述的模型训练方法，其特征在于，所述从所述目标域样本集和所述辅助域样本集中进行多轮采样，构建多个训练样本集，并基于所述多个训练样本集进行模型训练，得到所述多个中间模型，包括：

确定所述子模型的学习误差；

4.根据权利要求3所述的模型训练方法，其特征在于，所述确定所述子模型的学习误差，包括：

5.根据权利要求4所述的模型训练方法，其特征在于，所述根据所述子模型的学习误差调整所述目标域样本集中的每个样本的当前采样权重和所述辅助域样本集中的每个样本的当前采样权重，包括：

6.根据权利要求3所述的模型训练方法，其特征在于，所述调整所述辅助域样本集中的每个样本的当前采样权重，包括：

其中，n表示训练第n个子模型，n为大于2的整数，e表示自然对数的底数，sp表示所述预设迭代次数，Y(n)训练第n个子模型时的采样权重衰减系数。

7.一种需求量预测方法，其特征在于，包括：

获取目标物品的当前需求量特征数据；

利用如权利要求1至6任一项所述的模型训练方法训练得到的目标模型处理所述当前需求量特征数据，得到所述目标物品的预测需求量。

8.一种模型训练装置，其特征在于，包括：

构建模块，用于根据目标物品的历史需求量特征数据构建目标域样本集，并根据预设物品的历史需求量特征数据构建辅助域样本集，所述预设物品为属性与所述目标物品的属性相同的物品；其中，所构建的目标域样本集中包括多个样本，且目标域样本集中样本的分布是稀疏的，所述稀疏是指有些时间点有对应的样本，有些时间点没有对应的样本；所构建的辅助域样本集中包括多个样本，辅助域样本集中的样本数量多于目标域样本集中的样本数量；目标物品的样本数据量少且分布稀疏是由目标物品具有的特性导致的；

学习模块，用于对所述模型池中的中间模型和每个中间模型对应的训练样本集进行学习，得到用于对所述目标物品进行需求量预测的目标模型；

9.一种需求量预测装置，其特征在于，包括：

获取模块，用于获取目标物品的当前需求量特征数据；

预测模块，用于利用如权利要求1至6任一项所述的模型训练方法训练得到的目标模型处理所述当前需求量特征数据，得到所述目标物品的预测需求量。

10.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6中任一所述的模型训练方法，或者所述处理器执行所述程序时实现如权利要求7所述的需求量预测方法。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至6中任一所述的模型训练方法，或者该程序被处理器执行时实现如权利要求7所述的需求量预测方法。