CN113723985A - 销量预测模型的训练方法、装置及电子设备、存储介质 - Google Patents
销量预测模型的训练方法、装置及电子设备、存储介质 Download PDFInfo
- Publication number
- CN113723985A CN113723985A CN202110242143.3A CN202110242143A CN113723985A CN 113723985 A CN113723985 A CN 113723985A CN 202110242143 A CN202110242143 A CN 202110242143A CN 113723985 A CN113723985 A CN 113723985A
- Authority
- CN
- China
- Prior art keywords
- sales
- commodity
- prediction model
- training
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 346
- 238000000034 method Methods 0.000 title claims abstract description 116
- 238000003860 storage Methods 0.000 title claims description 20
- 238000012360 testing method Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 8
- 230000001502 supplementing effect Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 239000000047 product Substances 0.000 description 24
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 238000012216 screening Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提出了一种销量预测模型的训练方法及装置,该方法包括采集多个品类商品的第一历史销售数据,并基于所述第一历史销售数据,生成第一训练样本集;基于所述第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型;采集目标商品的第二历史销售数据,并基于所述第二历史销售数据,生成所述目标商品的第二训练样本集;基于所述第二训练样本集,对所述目标基础销量预测模型进行调整,以生成所述目标商品对应的目标销量预测模型。本申请中,以生成的高精准的目标基础销量预测模型作为单品类商品对应的基础预测模型,实现了对于具有小样本历史销售数据特征的单品类目标商品的销量预测,同时有效保证了销量预测的准确度和精准度。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及销量预测模型的训练方法、装置及电子设备、存储介质。
背景技术
商品销量预测,一定程度上影响着对于市场的布局和把控。
相关技术中,销量的预测方法,是根据不同的场景,获取到大量的历史销售数据,以实现对销量预测模型的训练,比如机器模型的训练和/或深度学习模型的训练等等。在完成销量预测模型的训练后,通过模型进行实际的商品销量预测。
实现中,很多场景无法获取到大量的历史销售数据,无法生成模型训练的训练样本集。使得部分场景的销量预测模型无法得到有效的训练,进而导致部分场景下的商品销量预测的结果与实际结果偏差较大。
比如,部分场景下,单一商品很难获取到大量的时间粒度历史销售数据,无法生成在该场景下的某单一商品的销量预测模型所需的训练样本集,进而无法实现对于模型的有效训练,使得该场景中无法实现对于商品销量的准确预测。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请第一方面提出一种销量预测模型的训练方法。
本申请第二方面还提出一种销量预测模型的训练装置。
本申请第三方面提出一种电子设备。
本申请第四方面提出一种计算机可读存储介质。
本申请第五方面提出一种计算机程序产品。
本申请第一方面提出一种销量预测模型的训练方法,包括采集多个品类商品的第一历史销售数据,并基于所述第一历史销售数据,生成第一训练样本集;基于所述第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型;采集目标商品的第二历史销售数据,并基于所述第二历史销售数据,生成所述目标商品的第二训练样本集;基于所述第二训练样本集,对所述目标基础销量预测模型进行调整,以生成所述目标商品对应的目标销量预测模型。
另外,本申请第一方面提出的销量预测模型的训练方法还可以具有如下附加的技术特征:
根据本申请的一个实施例,所述基于所述第二训练样本集,对所述目标基础销量预测模型进行调整,包括对所述目标基础销量预测模型进行备份;基于所述第二训练样本集,对备份的所述目标基础销量预测模型进行调整,生成所述目标商品对应的目标销量预测模型。
根据本申请的一个实施例,所述销量预测模型的训练方法,采用如下方式生成训练样本集:基于预设的滑动窗口,从采集的历史销售数据中提取出N个时间点对应的所述历史销售数据;提取第N+1个时间点的时间特征和所述N+1个时间点的实际销量;将所述N个时间点的所述历史销售数据、所述N+1个时间点的时间特征和所述N+1个时间点的实际销量作为所述训练样本集中的一组训练样本,并继续滑动所述滑动窗口至预设滑动次数,以生成所述训练样本集。
根据本申请的一个实施例,所述销量预测模型的训练方法,还包括:获取所述N+1个时间点的时间属性信息;基于所述时间属性信息,对所述N+1个时间点进行编码,生成所述N+1个时间点的时间特征。
根据本申请的一个实施例,所述销量预测模型的训练方法,还包括:从所述训练样本集中提取最大历史销量和最小历史销量;根据所述最大历史销量和所述最小历史销量,对所述训练样本集中的每个训练样本的历史销量进行归一化处理。
根据本申请的一个实施例,所述销量预测模型的训练方法,采用如下方式生成历史销售数据:获取商品订单,对所述商品订单进行合并,生成任一品类的订单数据;对所述任一品类的订单数据进行关键字段提取,对提取的所述关键字段对应的数据进行组合,生成所述任一品类的历史销售数据。
根据本申请的一个实施例,所述生成所述任一品类的历史销售数据之后,还包括:根据所述任一品类的历史销售数据,确定所述任一品类在设定时长内的销量;响应于所述设定时长内的销量小于预设销量阈值,则清除所述任一品类的历史销售数据。
根据本申请的一个实施例,所述对所述商品订单进行合并,生成任一品类的订单数据,包括:获取所述商品订单的生成时刻和商品品类;确定所述商品品类与所述任一品类一致的第一候选商品订单;针对所述任一品类,根据所述第一候选商品订单的生成时刻,确定属于同一时间段内的商品订单;将属于所述同一时间段内的商品订单进行合并,以生成所述任一品类的订单数据。
根据本申请的一个实施例,所述对所述商品订单进行合并,生成所述任一品类的订单数据,包括:获取所述商品订单对应的商品品类和品类等级;根据所述商品品类,确定属于所述任一品类的第二候选商品订单;获取所述任一品类的目标品类等级,并滤除所述品类等级高于所述目标品类等级的第二候选商品订单;对剩余的所述第二候选商品订单进行合并,以生成所述任一品类的订单数据。
根据本申请的一个实施例,所述采集目标商品的第二历史销售数据,包括:获取所述第二历史销售数据的数量;响应于所述数量低于预设数量,获取与所述目标商品相似的候选商品;选取所述候选商品的历史销售数据,补充为所述第二历史销售数据。
根据本申请的一个实施例,所述生成所述目标商品对应的目标销量预测模型之后,还包括:获取所述目标商品的第三历史销售数据;获取待预测时间点的时间特征;将所述第三历史销售数据和所述待预测时间点的时间特征,输入所述目标销量预测模型中,输出所述目标商品在所述待预测时间点上的预测销量。
为实现上述第一方面提出的销量预测模型的训练方法,本申请第二方面还提出销量预测模型的训练装置,包括第一训练样本集生成模块,用于采集多个品类商品的第一历史销售数据,并基于所述第一历史销售数据,生成第一训练样本集;模型训练模块,用于基于所述第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型;第二训练样本集生成模块,用于采集目标商品的第二历史销售数据,并基于所述第二历史销售数据,生成所述目标商品的第二训练样本集;模型调整模块,用于基于所述第二训练样本集,对所述目标基础销量预测模型进行调整,以生成所述目标商品对应的目标销量预测模型。
本申请第二方面提出的销量预测模型的训练装置还可以具有如下附加的技术特征:
根据本申请的一个实施例,所述模型调整模块,包括:备份单元,用于对所述目标基础销量预测模型进行备份;模型调整单元,用于基于所述第二训练样本集,对备份的所述目标基础销量预测模型进行调整,生成所述目标商品对应的目标销量预测模型。
根据本申请的一个实施例,所述销量预测模型的训练装置,还包括:销售数据获取模块,用于基于预设的滑动窗口,从采集的历史销售数据中提取出N个时间点对应的所述历史销售数据;提取模块,用于提取第N+1个时间点的时间特征和所述N+1个时间点的实际销量;训练样本集生成模块,用于将所述N个时间点的所述历史销售数据、所述N+1个时间点的时间特征和所述N+1个时间点的实际销量作为所述训练样本集中的一组训练样本,并继续滑动所述滑动窗口至预设滑动次数,以生成所述训练样本集。
根据本申请的一个实施例,所述销量预测模型的训练装置,还包括:时间属性信息获取模块,用于获取所述N+1个时间点的时间属性信息;编码模块,用于基于所述时间属性信息,对所述N+1个时间点进行编码,生成所述N+1个时间点的时间特征。
根据本申请的一个实施例,所述销量预测模型的训练装置,还包括:边缘销量提取模块,用于从所述训练样本集中提取最大历史销量和最小历史销量;归一化处理模块,用于根据所述最大历史销量和所述最小历史销量,对所述训练样本集中的每个训练样本的历史销量进行归一化处理。
根据本申请的一个实施例,所述销量预测模型的训练装置,还包括:订单数据生成模块,用于获取商品订单,对所述商品订单进行合并,生成任一品类的订单数据;历史销售数据生成模块,用于对所述任一品类的订单数据进行关键字段提取,对提取的所述关键字段对应的数据进行组合,生成所述任一品类的历史销售数据。
根据本申请的一个实施例,所述销量预测模型的训练装置,还包括:销量获取模块,用于根据所述任一品类的历史销售数据,确定所述任一品类在设定时长内的销量;清除模块,用于响应于所述设定时长内的销量小于预设销量阈值,则清除所述任一品类的历史销售数据。
根据本申请的一个实施例,所述订单数据生成模块,包括:订单信息获取单元,用于获取所述商品订单的生成时刻和商品品类;候选商品订单确定单元,用于确定所述商品品类与所述任一品类一致的第一候选商品订单;订单确定单元,用于针对所述任一品类,根据所述第一候选商品订单的生成时刻,确定属于同一时间段内的商品订单;订单数据生成单元,用于将属于所述同一时间段内的商品订单进行合并,以生成所述任一品类的订单数据。
根据本申请的一个实施例,所述订单数据生成模块,包括:订单信息获取单元,进一步用于获取所述商品订单对应的商品品类和品类等级;候选商品订单确定单元,进一步用于根据所述商品品类,确定属于所述任一品类的第二候选商品订单;订单确定单元,进一步用于获取所述任一品类的目标品类等级,并滤除所述品类等级高于所述目标品类等级的第二候选商品订单;订单数据生成单元,进一步用于对剩余的所述第二候选商品订单进行合并,以生成所述任一品类的订单数据。
根据本申请的一个实施例,所述第二训练样本集生成模块,包括:数量获取单元,用于获取所述第二历史销售数据的数量;候选商品获取单元,用于响应于所述数量低于预设数量,获取与所述目标商品相似的候选商品;数量补充单元,用于选取所述候选商品的历史销售数据,补充为所述第二历史销售数据。
根据本申请的一个实施例,所述销量预测模型的训练装置,还包括:第三历史销售数据获取模块,用于获取所述目标商品的第三历史销售数据;时间特征获取模块,用于获取待预测时间点的时间特征;测试模块,用于将所述第三历史销售数据和所述待预测时间点的时间特征,输入所述目标销量预测模型中,输出所述目标商品在所述待预测时间点上的预测销量。
为达到上述目的,本申请第三方面提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面提出的销量预测模型的训练方法。
本申请第四方面提出了一种计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面提出的销量预测模型的训练方法。
本申请第五方面提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述第一方面提出的销量预测模型的训练方法。
本申请提出的销量预测模型的训练方法及装置,根据订单记录数据获取第一历史销售数据,生成第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型。根据订单记录数据获取目标商品的第二历史销售数据,生成第二训练样本集,对目标基础销量预测模型进行训练,生成目标商品对应的目标销量预测模型。本申请中,生成的全品类对应的高精准的目标基础销量预测模型,可作为每个单品类商品对应的目标销量预测模型的基础预测模型,根据每个单品类商品的不同,实现了对于具有小样本历史销售数据特征的单品类目标商品的销量预测,同时,作为基础的全品类对应的目标基础销量预测模型具有高精准的预测功能,使得具有小样本历史销售数据特征的单品类目标商品的销量预测的准确度和精准度得到了有效的保证。
应当理解,本申请所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一实施例的销量预测模型训练方法的流程示意图;
图2为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图3为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图4为本申请另一个实施例的销量预测模型训练样本集生成方法的流程示意图;
图5为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图6为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图7为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图8为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图9为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图10为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图11为本申请另一个实施例的销量预测模型训练方法的流程示意图;
图12为本申请另一个实施例的销量预测模型测试方法的流程示意图;
图13为本申请另一个实施例的销量预测模型训练样本生成的方法示意图;
图14为本申请另一个实施例的销量预测模型测试样本生成的方法示意图;
图15为本申请一个实施例的销量预测模型训练装置的结构示意图;
图16为本申请另一个实施例的销量预测模型训练装置的结构示意图;
图17为本申请一个实施例的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参照附图描述本申请实施例的销量预测模型的训练方法、装置、电子设备和存储介质。
图1为本申请一实施例的销量预测模型训练方法的流程示意图,如图1所示,该销量预测模型的训练方法包括:
S101,采集多个品类商品的第一历史销售数据,并基于第一历史销售数据,生成第一训练样本集。
电商平台可以基于现有的市场对于商品类型的普遍认知,针对商品进行所属品类的划分,并设定好商品品类的相关信息作为商品的一个维度的描述信息。其中,商品品类的相关信息可以包括,各商品品类的名称、各商品品类的代码、各商品品类可以包括的商品类型明细等等。在商品上架时,可以根据设定好的商品品类的相关信息,确定该商品所属的商品品类。
电商平台对外展示商品,当商品的购买行为完成,可以生成该商品的一条销售数据。本申请实施例中,在销量预测模型的训练开始前,可以从数据库中提取到多个品类商品的第一历史销售数据。需要说明的是,多个品类可以为全品类,或者为全品类中销量较高的品类,以保证销量预测模型的训练可以获取到足量的有效的训练样本数据。例如,可以清除掉每日销量低于800的商品品类的第一历史销售数据。
其中,第一历史销售数据可以包括用户下单日期、下单时间、商品品类、商品订单量、订单金额。可选地,可以基于商品品类的品类标识获取该商品品类的第一历史销售数据,可以获取设定时长范围内的多个品类的第一历史销售数据,以保证模型训练的精准性。
进一步地,在获取到第一历史销售数据后,可以对第一历史销售数据进行预处理,可选地,可以将获取到的第一历史销售数据进行数据清洗、数据合并、转换等操作,其中,对于第一历史销售数据的预处理可以包括上述一项或者多项操作。进一步地,对经过预处理的第一历史销售数据进行特征提取,获取到第一训练样本集。
S102,基于第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型。
本申请实施例中,预先构建基础销量预测模型,并预先配置基础销售预测模型的训练参数,例如,训练次数、训练步长、结束时的训练误差等。
可选地,该基础销量预测模型可以为岭回归模型(ridge regression,Ridge)、复合树模型(XGBoost,XGB),神经网络模型(Neural Networks,NN),元学习模型(MetaLearning,MAML)等。
本申请实施例中,将第一训练样本集输入至基础销量预测模型进行训练,在每次训练过程中,可以基于训练误差计算损失函数,进而获取到模型梯度,基于获取的模型梯度对当前轮次的训练输出的基础销量预测模型的模型参数进行调整,直至满足模型训练的结束条件,生成目标基础销量预测模型。
比如,模型训练结束条件可以设定为以训练轮次的次数作为判断标准,预先设定训练的预设训练次数,当训练轮次与预设训练次数相同时,可以判定全部的模型训练进程结束,可以生成目标基础销量预测模型。
再比如,模型训练结束条件可以设定为以模型输出的结果的误差程度作为判断标准,预先设定训练进程结束后模型的输出结果可被允许的误差上限,将当前轮次训练的模型输出结果的误差与预设的误差上限进行对比,若当前轮次训练的模型输出结果的误差小于预设的误差上限时,可以判定全部的模型训练进程结束,可以生成目标基础销量预测模型。
S103,采集目标商品的第二历史销售数据,并基于第二历史销售数据,生成目标商品的第二训练样本集。
本申请实施例中,可以从数据库中提取到单个品类商品的第二历史销售数据,需要特别说明的是,需要对全品类中每个品类的商品的进行第二历史销售数据提取,以保证销量预测模型可以获取到全品类中每个商品品类的训练样本数据,进而达到每个单品类商品都可以存在对应的销量预测模型的效果。
其中,第二历史销售数据可以包括用户的下单日期、下单时间、商品品类、商品订单量、订单金额等等。可选地,可以基于商品品类的品类标识获取该商品品类的第二历史销售数据,可以获取每个商品品类中设定时长范围内的第二历史销售数据,以达到保证模型训练精准的效果。
进一步地,在获取到第二历史销售数据后,可以对第二历史销售数据进行预处理,可选地,可以将获取到的第二历史销售数据进行数据清洗、数据合并、数据转换等操作,其中,对于第二历史销售数据的预处理过程可以包括上述一项操作或者包括上述两个或两个以上的操作。进一步地,对经过预处理的第二历史销售数据进行特征提取,获取到目标商品的第二训练样本集。
S104,基于第二训练样本集,对目标基础销量预测模型进行调整,以生成目标商品对应的目标销量预测模型。
本申请实施例中,以目标基础销量预测模型作为基础模型,配置好相应的训练参数基于对目标基础销量预测模型进行的训练参数,将第二训练样本集输入至目标基础销量预测模型进行调整,直至满足模型调整的结束条件,生成目标商品对应的目标销量预测模型。目标商品对应的目标销量预测模型的训练过程,即目标基础销量预测模型的调整过程,与生成目标基础销量预测模型的训练过程类似,此处不再赘述。
本申请提出的销量预测模型的训练方法,根据订单记录数据获取第一历史销售数据,生成第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型。根据订单记录数据获取目标商品的第二历史销售数据,生成第二训练样本集,对目标基础销量预测模型进行调整,生成目标商品对应的目标销量预测模型。本申请中,生成的全品类对应的高精准的目标基础销量预测模型,可作为每个单品类商品对应的目标销量预测模型的基础预测模型,根据每个单品类商品的不同,实现了对于具有小样本历史销售数据特征的单品类目标商品的销量预测,同时,作为基础的全品类对应的目标基础销量预测模型具有高精准的预测功能,使得具有小样本历史销售数据特征的单品类目标商品的销量预测的准确度和精准度得到了有效的保证。
图2为本申请另一实施例的销量预测模型训练方法的流程示意图,如图2所示,该销量预测模型的训练方法包括:
S201,采集多个品类商品的第一历史销售数据,并基于第一历史销售数据,生成第一训练样本集。
S202,基于第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型。
S203,采集目标商品的第二历史销售数据,并基于第二历史销售数据,生成目标商品的第二训练样本集。
步骤S201~S203可参见上述相关详细内容,此处不再赘述。
S204,对目标基础销量预测模型进行备份。
本申请实施例中,目标基础销量预测模型是可以实现全品类商品销量预测的模型,是单品类目标商品对应的目标基础销量预测模型生成的基础模型。为了使得该目标基础销量预测模型可以多次使用,防止被某一类商品调整后,导致无法被其他类商品使用,因此需要对目标基础销量预测模型进行备份。
S205,基于第二训练样本集,对备份的目标基础销量预测模型进行调整,生成目标商品对应的目标销量预测模型。
步骤S205可参见上述步骤S104的相关详细内容,此处不再赘述。
获取任一目标商品的第二历史销量数据,基于该第二历史销量数据生成第二训练样本集,基于该第二训练样本集,对备份的目标基础销量预测模型进行调整,生成该目标商品的目标销量预测模型的调整。
为更好理解上述实施例,可结合图3,如图3所示,通过多品类商品对应的第一训练样本集,训练出一个目标基础销量预测模型。进一步地,可以针对每个目标商品进行一次备份,即对A商品、B商品和C商品分别进行一次,获取到三个备份的目标基础销量预测模型,然后再基于A商品对应的第二训练样本集对备份的目标基础销量预测模型进行调整,继而可以得到A商品的目标销量预测模型A。类似地,可以即基于B商品对应的第二训练样本集对备份的目标基础销量预测模型进行调整,继而可以得到B商品的目标销量预测模型B;类似地,可以即基于C商品对应的第二训练样本集对备份的目标基础销量预测模型进行调整,继而可以得到C商品的目标销量预测模型C。备份的过程即为对目标基础销量预测模型进行模型迁移的过程,可以将模型的参数和性能迁移到目标商品上进行使用。
本申请提出的销量预测模型的训练方法,先基于多品类形成的第一训练样本集训练出目标基础销量预测模型,并对目标基础销量预测模型进行备份,再基于目标商品的第二训练样本集,对备份的目标基础销量预测模型进行调整,生成目标商品对应的目标销量预测模型。本申请中,生成的全品类对应的高精准的目标基础销量预测模型,可作为每个单品类商品对应的目标销量预测模型的基础预测模型,在需要对特定商品的销量进行预测,可以对备份的目标基础销量预测模型进行调整,从而保证目标基础销量预测模型的模型参数维持不变,使得该目标基础销量预测模型可以多次使用,当目标基础销量预测模型基于某一商品调整后,会导致目标基础销量预测模型的模型参数发生变化,变化后的模型更适用于该商品,为了保证商品之间的对于目标基础销量预测模型的调整互不影响,需要对模型进行备份。若不进行备份,当目标基础销量预测模型基于其他商品进行销量预测模型调整时,所使用的的基础的目标销量预测模型是基于某一商品调整后的模型,该情况下的销量预测调整后的模型的预测效果和准确度较低。
为更好的理解上述实施例提出的基于第一历史数据的第一训练样本集以及基于第二历史销售数据的第二训练样本集的生成方法,如图4所示,图4为本申请另一实施例的销量预测模型训练样本集生成方法的流程示意图,该训练样本集的生成方法包括:
S401,基于预设的滑动窗口,从采集的历史销售数据中提取出N个时间点对应的历史销售数据。
滑动窗口,可以从订单记录数据中获取不同时间点对应的订单记录数据。
滑动窗口的大小,可以确定采集的历史数据的对应的时间点的多少。
实现中,根据需求设定滑动窗口的大小,基于预设大小的滑动窗口,在采集的历史销售数据中滑动,获取到N个时间点对应的历史销售数据。
比如,设定滑动窗口大小为30个单位,在使用滑动窗口从采集的历史销售数据中进行数据提取时,可以获取到30个时间点对应的历史销售数据,如2020年12月1日至2020年12月30日的连续30个自然日对应的历史销售数据。
再比如,设定滑动窗口的大小为7个单位,在使用滑动窗口从采集的历史销售数据中进行数据提取时,可以获取到7个时间点对应的历史销售数据,如2020年12月1日至2020年12月7日的连续7个自然日对应的历史销售数据。
S402,提取第N+1个时间点的时间特征和N+1个时间点的实际销量。
一般情况下,时间点的时间特征往往会是影响该时间点实际销量的影响因数,比如,时间点为节假日或者特定促销日,实际销量往往会高于日常销量。本申请实施例中,可以从提取到时间特征,比如年、月、日、是否为促销日等等相关信息。
本申请实施例中,在确定了第N+1时间点后,可以获取到该第N+1个时间点对应的历史销售数据,进而提取N+1时间点对应的实际销量,同时,提取N+1时间点对应的时间特征。
依然以上述示例为例,设定N+1时间点为2020年12月31日,则滑动窗口根据时间点获取到2020年12月31日的历史销售数据,同时,提取到该时间点的时间特征,为2020年、12月、31日、周四、元旦活动促销日等等相关信息。
S403,将N个时间点的历史销售数据、N+1个时间点的时间特征和N+1个时间点的实际销量作为训练样本集中的一组训练样本,并继续滑动滑动窗口至预设滑动次数,以生成训练样本集。
本申请实施例中,将N个时间点的历史销售数据、N+1个时间点的时间特征和N+1个时间点的实际销量作为训练样本集中的一组训练样本。
根据N个时间点的历史销售数据,结合基础销量预测模型的运算规则以及N+1时间点的时间特征,对N+1时间点的商品销量进行预测,输出商品销量预测的预测销量。将输出的销量预测模型的预测销量与获取到的N+1时间点对应的实际销量进行对比,根据对比结果的准确程度与偏差程度,对基础销量预测模型的模型参数进行调整,使得N+1时间点的基础销量预测模型的预测销量可以最大限度的接近N+1时间点的实际销量,以完成对基础销量预测模型当前轮次的训练。
为了达到更好的训练效果,使得基础销量预测模型的预测销量可以无限的接近实际销量,需要多次进行基于训练样本的模型训练与调整。根据基础销量预测模型的对于训练样本集数量的需求,设定滑动窗口的预设滑动次数,预设滑动次数决定了训练样本集中训练样本的数量。每一次滑动滑动窗口,均可以获取到N个时间点的历史销售数据、N+1个时间点的时间特征和N+1个时间点的实际销量组合的一组训练样本。
为了获取较多的训练样本,以生成销量预测模型的训练或调整所需的足量的样本数据,需要重复滑动滑动窗口至预设次数,可以获取到预设次数对应的数量的训练样本,将预设次数对应的数量的训练样本进行组合,进而获取到相应的训练样本集。
比如,设定滑动窗口大小为30个单位,滑动窗口预设滑动次数为100次,重复滑动滑动窗口,可以获取到30个时间点对应的历史销售数据,共计100组,每一组的历史销售数据构成了一个训练样本,全部100组的历史销售数据构成了一个训练样本集。
本申请提出的销量预测模型的训练方法,通过滑动窗口获取N个时间点对应的历史销售数据、N+1时间点的时间特征以及N+1时间点对应的实际销量数据,将获取到的三组数据组合成为一个训练样本。预设滑动窗口滑动次数,获取到滑动次数对应数量的训练样本,进而生成一个训练样本集。本申请中,通过滑动窗口实现了各时间点对应的数据的获取以及时间特征的提取,保证了训练样本的有效生成,进而生成了可以提供正确有效训练数据的训练样本集,实现了基础销量预测模型的高效训练。
为更好的理解上述实施例提出的训练样本集的生成方法,可以结合图5,图5为本申请另一实施例的销量预测模型训练方法的流程示意图,如图5所示,该方法包括:
S501,获取N+1个时间点的时间属性信息。
本申请实施例中,可以通过滑动窗口获取到N+1个时间点的时间属性信息,比如年、月、日、周等等。可以设定订单记录中,关于时间属性信息的记录格式,根据预设的格式确定筛选条件,根据筛选条件获取到时间点对应的时间属性信息。
比如,设定订单记录信息内对于时间属性信息的记录格式为2021年01月28日周四,可以设定以“年”为关键字,筛选规则为“年”关键字前面相邻的数字为订单的年份,则可以获取到该时间点的年时间属性信息为“2021”。可以设定“周”为关键字,筛选规则为“周”关键字后面相邻的数字为订单生成所属的当周的第几天,则可以获取到该时间点的周时间属性信息为“周四”。
S502,基于时间属性信息,对N+1个时间点进行编码,生成N+1个时间点的时间特征。
为了保证销量预测模型在不同时间场景下的有效性,使得不同时间点的历史销售数据均可以有效适用于基础销量预测模型,需要对训练样本集内的时间属性信息进行编码,可以根据获取到的N+1个时间点的时间属性信息,按统一的方式进行编码,生成N+1个时间点对应的时间特征。
比如,设定编码方式采用独热编码规则,N+1个时间点的其中一个的周时间属性信息为“周一”,则根据独热编码的规则,对“周一”进行编码,生成编码为1000000的时间特征。再比如,N+1个时间点的其中一个的周时间属性信息为“周三”,则根据独热编码的规则,对“周三”进行编码,生成编码为0010000的时间特征。
根据不同的时间属性信息的不同取值范围,可以设定不同的编码格式,比如月的取值范围为0~12、日的取值范围为1~31、周的取值范围为1~7等等。可以将每个取值映射成一个向量,对应的位置为1,其余位置为0。比如月份为3月时,将“3”映射成为一个向量,依然以独热编码为例,根据独热编码的规则,可以生成001000000000的月时间特征。
本申请提出的销量预测模型的训练方法,获取N+1个时间点的时间属性信息,根据设定的编码规则,对时间属性信息进行统一的编码,生成N+1个时间点对应的时间特征。本申请中,通过对时间属性信息设定统一的编码规则,实现了各时间点对应的时间属性信息所生成的时间特征的统一,保证了销量预测模型的训练的有效性。
图6为本申请另一实施例的销量预测模型训练方法的流程示意图,如图5所示,该销量预测模型的训练方法包括:
S601,从训练样本集中提取最大历史销量和最小历史销量。
历史销量数据是连续性变量,不同的商品品类在不同的时间范围,商品的历史销量数据存在较大的差异。
本申请实施例中,可以对训练样本集被的销量数据进行大小排序,进而提取到最大历史销量数据和最小历史销量数据。
S602,根据最大历史销量和最小历史销量,对训练样本集中的每个训练样本的历史销量进行归一化处理。
本申请实施例中,为了满足神经网络的激活函数的要求,需要对差异化较大的历史销量数据进行归一化处理,进而使得历史销量数据归一化至设定的范围内。
实现中,神经网络模型对于不同的量纲的敏感性较强,且神经网络的激活函数的值域一般是-1~1,故而需要对历史销量数据的特征采用最小最大归一化方法(MinMaxScaler),实现方式如下:
其中,xmin,xmax分别代表对应维度的最大历史销量数据和最小历史销量数据。
本申请实施例提出的销量预测模型训练方法,提取最大历史销量数据和最小历史销量书,基于神经网络的激活函数的要求,对历史销量数据特征采用归一化处理,使得历史销量数据之间的差异化降低,提高销量预测模型训练的有效性。
为更好理解上述实施例提出的历史销售数据的提取和生成的方法,可结合图7,图7为本申请另一实施例的销量预测模型训练方法的流程示意图,如图7所示,该方法包括:
S701,获取商品订单,对商品订单进行合并,生成任一品类的订单数据。
为了生成可以为销量预测模型训练提供有效训练的样本集,需要从订单记录数据中提取到历史销售数据,作为生成训练样本的数据基础。商品订单,为用户在平台下单时生成,其中,商品订单可以包括用户下单日期、下单时间、商品品类、商品订单量、订单金额、是否含有优惠、优惠券类型、优惠金额等等。生成商品订单后,可以存储于平台的设定位置。
本申请实施例中,根据设定的筛选条件,从商品订单存储的设定位置进行筛选,获取原始的商品订单。将获取到的原始商品订单进行合并,生成任一品类的订单数据。
实现中,可以将商品订单的时间属性信息和商品品类属性信息作为设定的筛选条件,以商品订单的时间属性信息作为关键字,在设定位置筛选出符合设定时间范围内的全品类商品的原始订单,再以商品品类信息为关键字,再一次筛选,从中获取到任一品类的原始的商品订单,将获取到的任一品类的原始商品订单进行合并,可以生成任一品类的订单数据。
其中,获取到的原始商品订单是各自单独存储的同一格式的订单记录数据,需要对获取到的单独的原始商品订单进行合并操作,以生成任一品类的订单数据。比如,以时间属性维度为例,商品订单生产时刻的时间粒度可以精确至分或者秒,故而,在设定时长范围内获取的商品订单由于生成时刻的不同,可以生成多个单独存储的商品订单记录,进行商品订单的记录进行合并操作,可以生成订单数据。
作为一种可能实现的方式,如图8所示,从时间维度上,对于对商品订单进行合并,生成任一品类的订单数据,该方法如下:
S7011,获取商品订单的生成时刻和商品品类。
本申请实施例中,可以根据商品订单的所包含的属性信息,获取商品订单的生成时刻和商品品类。商品订单中包含的时间属性信息,即为商品订单生成的时间。
实现中,可以设定商品订单中所包含的全部信息的固定记录格式以及在商品订单信息中的排序位置,使得平台上全部商品的商品订单均以相同的格式进行记录和存储,其中,全部的商品订单中的相同字段对应的属性信息处于相同的位置。可以获取时间属性信息和商品品类信息的固定记录格式以及二者在商品订单记录中所处的记录位置,对商品订单进行关键字段的提取,获取到关键字段商品订单的生成时刻和商品品类。
其中,获取到的关键字段,商品品类的信息和商品订单的生成时刻是全品类的。
S7013,确定商品品类与任一品类一致的第一候选商品订单。
本申请实施例中,获取到商品订单中的商品品类信息后,将任一品类的商品品类信息作为关键字,在获取到的全品类的商品订单中的商品品类信息中进行关键字提取,确定与任一品类的商品品类信息一致的商品品类对应的商品订单,生成第一候选商品订单。
比如,设定任一品类的商品品类信息为“电子产品品类”,获取到的全品类的商品品类信息中,包含平台上所有的商品的所属品类信息。将“电子产品品类”作为关键字,在获取到的全品类的商品品类信息中进行关键字提取操作,确定了全品类的商品品类信息中,与“电子产品品类”的商品品类一致的对应的商品订单,生成“电子产品品类”的第一候选商品订单。
其中,任一品类的第一候选商品订单,为任一品类下所有商品自开始销售起的全部的商品订单。
S7015,针对任一品类,根据第一候选商品订单的生成时刻,确定属于同一时间段内的商品订单。
本申请实施例中,生成第一候选商品订单后,将任一品类的订单数据所需求的时间范围作为关键字,在获取到的任一品类的第一候选商品订单的商品订单生成时刻的关键字段中进行筛选,获取到与任一品类的订单数据所需的时间范围内的商品订单生成时刻,进而获取到与任一品类的订单数据所需求的时间范围处于同一时间范围内的商品订单。
依然以上述“电子产品品类”的第一候选商品订单为例,在获取到自开售以来的全部时间范围内的“电子产品品类”的第一候选商品订单后,设定“电子产品品类”的订单数据所需时间范围为1个月,设定获取2020年10月至12月三个月内每个月的商品订单,可以将“2020年10月”、“2020年11月”、“2020年12月”三个时间范围作为关键字,在第一候选商品订单中的商品订单生成时刻进行筛选,获取到处于2020年10月至12月三个月的时间范围每个月的商户订单生成时刻对应的商品订单。
S7017,将属于同一时间段内的商品订单进行合并,以生成任一品类的订单数据。
作为一种可能实现的方式,如图9所示,从商品品类维度上,对于对商品订单进行合并,生成任一品类的订单数据,该方法如下:
S7012,获取商品订单对应的商品品类和品类等级。
本申请实施例中,可以根据商品订单的所包含的属性信息,获取商品订单对应的商品品类和品类等级。
其中,关于商品品类等级,在同一商品品类中,根据分类细化程度的不同,可以将商品品类划分为不同的等级。在设定商品品类的等级之后,可以将预设的商品品类各等级的相关信息与等级之间的关系存储于设定位置中。
以服饰类的商品品类为例,设定服饰类的商品品类包含女装类、男装类、童装类等,其中,女装类的商品品类中包含裙装类、上衣类、裤装类、套装类等,其中的裙装类包括连衣裙类、半身裙类,其中的半身裙类还可以包括长裙类和短裙类等等。根据上述示例可知,根据服饰类不同细化程度进行划分的商品品类之间具有范围层面上的级别关系。所包含的商品品类范围越广,商品品类的级别越高。上述示例中,级别最高的商品品类为“服装类”,次一级的商品品类为“女装类、男装类、童装类”,再次一级的商品品类为“裙装类、上衣类、裤装类、套装类”,可依次类推。
实现中,可以依然设定商品订单中所包含的全部信息的固定记录格式以及在商品订单信息中的排序位置,使得平台上全部商品的商品订单均以相同的格式进行记录和存储,其中,全部的商品订单中的相同字段对应的属性信息处于相同的位置。根据商品订单中的固定记录格式和各个信息的所处位置,获取到商品订单中的商品品类信息,同时,根据获取到的商品品类信息,判定该品类商品的商品品类等级。
其中,获取到的关键字段,商品品类的信息和商品品类的等级包含的是全品类的。
S7014,根据商品品类,确定属于任一品类的第二候选商品订单。
本申请实施例中,获取到全品类的商品订单中的商品品类信息后,将任一品类的品类信息作为关键字,在获取到的全品类的商品品类信息中进行筛选。其中,筛选出的结果可以是商品品类信息与任一品类的相一致,也可以是商品品类的等级与任一品类属于同一商品品类系列的次一级及以下的关系。上述两种结果所筛选出的商品品类信息所对应的商品订单,可以确定为属于任一品类的第二候选商品订单。
可以以上述服饰类商品中的女装类商品品类为例,获取到全部商品订单的商品品类信息后,将“女装类”作为关键字段,在全部的商品品类信息中进行筛选,将商品品类信息为“女装类”的商品所对应的商品订单作为“女装类”对应的第二候选商品订单。
S7016,获取任一品类的目标品类等级,并滤除品类等级高于目标品类等级的第二候选商品订单。
本申请实施例中,根据任一品类的同系列的商品品类级别划分的相关信息,可以确定该系列中,各商品品类之间的级别关系,可以是同级别、也可以是高级别与低级别。
在任一品类所包含的全部等级的商品品类中,确定一个目标品类,根据目标品类的细化程度和包含的商品范围,确定目标品类的等级。获取任一品类的第二候选商品订单中,全部订单的商品品类的等级信息,与目标品类的等级信息进行对比,删除其中等级高于目标品类等级的商品品类对应的商品订单,获取到目标品类等级的第二候选商品订单。
依然可以以上述服饰类的商品品类为例,任一品类设定为服饰类,所以,获取到的是全部服饰类的商品订单作为第二候选商品订单,设定目标商品品类的级别为次二级“裙装类、套装类”,故而,需要将全部的服饰类商品订单中,最高级别“服饰类”对应的商品订单与次一级的“女装类、男装类、童装类”对应的商品订单进行滤除处理,获取到与“裙装类、套装类”商品品类级别相同或者次一级及以下级别的商品品类所对应的商品订单,作为“裙装类、套装类”等级对应的第二候选商品订单。
S7018,对剩余的第二候选商品订单进行合并,以生成任一品类的订单数据。
本申请提出的销量预测模型的训练方法中的任一品类的订单数据的生成方法,从时间维度和商品品类维度这两个可能实现的方式进行分析,表述了任意品类的订单数据可能实现的生成方式。
需要特别说明的是,上述实施例可适用于第一历史销售数据以及第二历史销售数据的获取,同时,上述实施例仅为本申请提出的示例,不能作为对本申请的限制。
S702,对任一品类的订单数据进行关键字段提取,对提取的关键字段对应的数据进行组合,生成任一品类的历史销售数据。
为了使得历史销售数据生成的训练样本集,可以最大限度的为销量预测模型的训练提供有效的数据,可以根据训练样本的需求对订单数据进行提取,生成相应的历史销售数据。
实现中,商品的实际销量会受到类似节假日、促销活动日等信息的影响,节假日和促销活动类似的时间范围内,商品的实际销量较平时会有所提升。为实现销量预测模型对于销量的高精准预测,故而,模型训练所需的训练样本中需要携带销量数据和时间属性信息。
本申请实施例中,可以将销量数据和时间属性信息作为关键字段,从任一品类的订单数据中进行关键字段的提取,将关键字段对应的订单数据中的信息片段进行组合,进而生成任一品类的商品的历史销售数据。可选地,关键字还可以包括是否促销、商品品类等,此处仅为示例,不做具体限定。
比如,设定关键字段的设定提取条件为销量数据和时间属性信息2020年12月,将2020年12月以及销量数据作为关键字段,从任一品类的订单数据中,提取到2020年12月时间范围下单的所有订单中的时间属性信息片段,以及2020年12月时间范围下单的所有订单中携带的销量数据信息片段,将时间属性信息片段与销量数据信息片段进行组合操作,生成任一品类2020年12月的历史销售数据。
本申请提出的销量预测模型训练方法,通过设定的筛选条件,获取商品订单,生成任一品类的订单数据,通过关键字段的提取,获取对应的订单数据,进而生成任一品类的历史销售数据。本申请中,保证了历史销售数据的有效性,使得基于历史销售数据生成的训练样本集可以正确高效的为销量预测模型训练提供训练数据,进而保证了销量预测模型训练的训练效果。
生成任一品类的历史销售数据后,可如图10所示,图10为本申请另一实施例的销量预测模型训练方法的流程示意图,该销量预测模型的训练方法包括:
S1001,根据任一品类的历史销售数据,确定任一品类在设定时长内的销量。
本申请实施例中,获取任一品类的历史销售数据,根据需求设定所需时间范围,并将设定的时间范围作为筛选条件。对任一品类的历史销售数据进行关键字段时间属性信息的提取,获取提取出的时间属性信息,以设定的时间范围为条件从中进行筛选,获取到处于设定时间范围内的时间属性信息,进而获取到相应的任一品类的历史销售数据,同时,可以对提取出的时间属性信息的数量进行统计,进而获取到任一品类的商品在设定时长内的销量。
S1002,响应于设定时长内的销量小于预设销量阈值,则清除任一品类的历史销售数据。
为了更好的实现目标基础销量预测模型的调整,根据模型调整所需的样本集的要求,设定销量阈值。
本申请实施例中,将获取到的任一品类的商品在设定时长内的销量,与设定的销量阈值进行对比,若任一品类的商品在设定时长内的销量小于设定的销量阈值时,可以理解为,该任一品类的历史销售数据,无法为目标基础销量预测模型的调整提供足量有效的数据样本,故而,进行清除处理。
比如,设定销量预测模型所需销量数据的数量下限为800,则在获取第一历史销量数据时,可以清除掉每日销量不足800的历史销量数据,或者在获取第二历史销量数据时,可以清除掉每日销量不足300的历史销量数据。
本申请提出的销量预测模型的训练方法,通过获取任一品类的商品在设定时长内的销量与预设的销量阈值进行对比,确定任一品类的历史销售数据能否为目标基础销量预测模型的调整提供足量有效的数据样本,对于无法提供足量有效的数据样本的任一品类的历史销售数据进行清除处理。本申请中,通过对任一品类的历史销售数据的销量的限定,保证了任一品类的历史销售数据所生成的样本的有效性,进而保证了目标基础销量预测模型的调整效果。
图11为本申请另一实施例的销量预测模型训练方法的流程示意图,如图11所示,该销量预测模型的训练方法包括:
S1101,获取第二历史销售数据的数量。
第二历史销售数据,为某一品类的商品在某一时间段内的订单记录数据,可以为目标基础销量预测模型训练的调整提供数据源。
为了保证目标基础销量预测模型,可以基于第二历史销售数据,调整到目标基础销量预测模型的最优状态,使得目标基础销量预测模型的预测销量可以无限接近于实际的销量,则需要保证第二历史销售数据生成的样本的数量。
本申请实施例中,可以将第二历史销售数据中,某一个字段作为关键字进行提取,根据提取出的关键字段的数量,可以获取到第二历史销售数据的数量。
比如,可以将第二历史销售数据中的商品订单生成时间作为关键字段进行提取,根据提取到的商品订单生成时间的数量,可以确定第二历史销售数据的数量。
S1102,响应于数量低于预设数量,获取与目标商品相似的候选商品。
为了保证目标销量预测模型的调整效果,根据模型调整对于样本所需数量的最小值,设定预设数量。
本申请实施例中,当获取到的第二历史销售数据的数量小于预设数量时,可以理解为,当前的第二历史销售数据无法为目标销量预测模型的调整提供充足有效的样本。针对该种情况,可以提出的改进方法为,根据第二历史销售数据所属的商品品类信息,与其他商品品类信息进行对比,获取到与第二历史销售数据所属的商品品类相似的商品品类作为候选商品品类。
比如,设定第二历史销售数据为品牌A的限量版球鞋,预设数量为20,第二历史销售数据的数量为15,此时第二历史销售数据的数量低于预设数量。此时,将品牌A所属的商品品类信息与其他商品品类信息进行对比,获取到品牌B与品牌A的所属商品品类一致,且两个品牌下的限量版球鞋概念相似,所以,可以将品牌B的限量版球鞋作为品牌A的限量版球鞋的候选商品。
S1103,选取候选商品的历史销售数据,补充为第二历史销售数据。
本申请实施例中,确定候选商品后,根据第二历史销售数据的时间范围的限定,获取到候选商品的历史销售数据,补充进第二历史销售数据中,使得第二历史销售数据的数量达到预设数量。
依然以上述品牌A和品牌B的限量版球鞋为例,品牌A的第二历史销售数据的数量为15,确定品牌B的限量版球鞋为候选商品后,根据品牌A的第二历史销售数据的筛选条件,筛选品牌B的限量版球鞋相同限制条件下的销售数据,共计10组,将该10组历史销售数据补充进第二历史销售数据中,此时第二历史销售数据的数量为25,大于预设数量的20组,此时的第二历史销售数据可以为目标基础销量预测模型的调整提供足量有效的数据源。
本申请提出的销量预测模型的训练方法,判断第二历史销售数据的数量是否小于预设的数量,响应于第二历史销售数据的数量小于预设的数量,可以选取候选商品的历史销售数据进行补充。本申请中,提出了第二历史销售数据的样本数量不足的情况下,可以使用的一种解决方法,有效保证了第二历史销售数据可以提供的样本数量,进而保证了目标基础销量预测模型的调整效果,使得目标基础销量预测模型的预测销量可以无限接近于实际销量。
在生成目标商品对应的目标基础销量预测模型后,可以根据生成的模型对商品销量进行预测的测试,如图12所示,图12为本申请另一实施例的销量预测模型测试方法的流程示意图,该销量预测模型的训练方法包括:
S1201,获取目标商品的第三历史销售数据。
本申请实施例中,可以根据当前的目标基础销量预测模型的测试需求,确定需要进行销量预测的目标商品,将目标商品的相关信息,比如商品名称,作为关键字,在订单记录数据的设定存储位置进行筛选,获取目标商品的全部订单记录数据。
根据目标商品对应的目标基础销量预测模型所需的样本时间范围,设定所需订单记录数据的筛选时间范围,将该时间范围作为筛选条件,在获取到的目标商品对应的全部订单记录数据中进行筛选,以获取到目标商品对应的设定时间范围内的订单记录数据,生成目标商品的第三历史销售数据。
S1202,获取待预测时间点的时间特征。
实现中,根据目标基础销量预测模型的测试需求,确定目标商品待预测销量的时间点,根据设定的待预测时间点,可以提取到相应的时间特征。具体的提取方法,可参见上述相关内容,此处不再赘述。
S1203,将第三历史销售数据和待预测时间点的时间特征,输入目标销量预测模型中,输出目标商品在待预测时间点上的预测销量。
本申请实施例中,在获取到目标商品对应的第三历史销售数据,和待预测时间点的时间特征后,将二者根据目标商品对应的目标基础销量预测模型设定的格式,输入至目标商品对应目标基础销量预测模型里,执行算法ypred=f(xtest),输出目标商品在待预测时间点上的预测销量,完成模型的测试工作。
为更好的理解上述实施例提出的第一训练样本集的生成,在获取第一历史销售数据的过程中,每个品类商品的历史销量数据无需进行划分,均用来作为第一历史销量数据,如图13所示,商品E、商品F、商品G、商品H,分别提取的第一历史销售数据进行组合,生成多品类的基础销量预测模型训练的第一训练样本集。
为了保证基础销量预测模型可以得到充分有效的训练,训练样本需要覆盖多品类商品的各种时间段对应的历史销售数据,以保证模型训练完成后,在实际的销量预测工作中,可以在极端的场景下实现销量预测结果无限接近于实际销量。
为了在基础销量预测模型的基础上调整出适用于某一商品的目标销量预测模型,并且在某一商品对应的目标销量预测模型调整结束后,对某一商品进行销量预测,以测试调整后的目标销量预测模型的准确度,因此,一个品类的历史销量数据被分成两部分,其中一部分作为第二历史销售数据,剩余的部分作为第三历史销售数据。如图14所示,商品E、商品F、商品G、商品H,分别提取两份不等量的历史销售数据,其中一份作为目标商品对应的第二历史销售数据组合成第二训练样本集,输入到目标基础销量预测模型中,以训练出目标商品对应的目标销量预测模型。另一部分作为目标商品对应的的第三历史销售数据,将第三历史销售数据输入到目标销量预测模型中,预测出该目标商品的当天或未来某天的预测销量。
与上述几种实施例提出的销量预测模型的训练方法相对应,本申请的一个实施例还提出了一种销量预测模型的训练装置,由于本申请实施例提出的销量预测模型的训练装置与上述几种实施例提出的销量预测模型的训练方法相对应,因此上述销量预测模型的训练方法的实施方式也适用于本申请实施例提出的销量预测模型的训练装置,在下述实施例中不再详细描述。
图15为本申请一实施例的销量预测模型训练装置的结构示意图,如图15所示,销量预测模型的训练装置1500,包括第一训练样本集生成模块151、模型训练模块152、第二训练样本集生成模块153、模型调整模块154,其中:
第一训练样本集生成模块151,用于采集多个品类商品的第一历史销售数据,并基于第一历史销售数据,生成第一训练样本集;
模型训练模块152,用于基于第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型;
第二训练样本集生成模块153,用于采集目标商品的第二历史销售数据,并基于第二历史销售数据,生成目标商品的第二训练样本集;
模型调整模块154,用于基于第二训练样本集,对目标基础销量预测模型进行调整,以生成目标商品对应的目标销量预测模型。
本申请提出的销量预测模型的训练装置,根据订单记录数据获取第一历史销售数据,生成第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型。根据订单记录数据获取目标商品的第二历史销售数据,生成第二训练样本集,对目标基础销量预测模型进行调整,生成目标商品对应的目标销量预测模型。本申请中,生成的全品类对应的高精准的目标基础销量预测模型,可作为每个单品类商品对应的目标销量预测模型的基础预测模型,根据每个单品类商品的不同,实现了对于具有小样本历史销售数据特征的单品类目标商品的销量预测,同时,作为基础的全品类对应的目标基础销量预测模型具有高精准的预测功能,使得具有小样本历史销售数据特征的单品类目标商品的销量预测的准确度和精准度得到了有效的保证。
图16为本申请另一实施例的销量预测模型训练装置的结构示意图,如图16所示,销量预测模型的训练装置1600,包括第一训练样本集生成模块161、模型训练模块162、第二训练样本集生成模块163、模型调整模块164、销售数据获取模块165、提取模块166、训练样本集生成模块167、时间属性信息获取模块168、编码模块169、边缘销量提取模块1610、归一化处理模块1611、订单数据生成模块1612、历史销售数据生成模块1613、销量获取模块1614、清除模块1615、第三历史销售数据获取模块1616、时间特征获取模块1617、测试模块1618,其中:
需要特别说明的是,第一训练样本集生成模块151、模型训练模块152、第二训练样本集生成模块153、模型调整模块154与第一训练样本集生成模块161、模型训练模块162、第二训练样本集生成模块163、模型调整模块164,具有相同的结构和功能。
本申请实施例中,模型调整模块164,包括:
备份单元1641,用于对目标基础销量预测模型进行备份;
模型调整单元1642,用于基于第二训练样本集,对备份的目标基础销量预测模型进行调整,生成目标商品对应的目标销量预测模型。
本申请实施例中,销量预测模型的训练装置1600,还包括销售数据获取模块165、提取模块166、训练样本集生成模块167,其中:
销售数据获取模块165,用于基于预设的滑动窗口,从采集的历史销售数据中提取出N个时间点对应的历史销售数据;
提取模块166,用于提取第N+1个时间点的时间特征和N+1个时间点的实际销量;
训练样本集生成模块167,用于将N个时间点的历史销售数据、N+1个时间点的时间特征和N+1个时间点的实际销量作为训练样本集中的一组训练样本,并继续滑动滑动窗口至预设滑动次数,以生成训练样本集。
本申请实施例中,销量预测模型的训练装置1600,还包括时间属性信息获取模块168、编码模块169,其中:
时间属性信息获取模块168,用于获取N+1个时间点的时间属性信息;
编码模块169,用于基于时间属性信息,对N+1个时间点进行编码,生成N+1个时间点的时间特征。
本申请实施例中,销量预测模型的训练装置1600,还包括边缘销量提取模块1610、归一化处理模块1611,其中:
边缘销量提取模块1610,用于从训练样本集中提取最大历史销量和最小历史销量;
归一化处理模块1611,用于根据最大历史销量和最小历史销量,对训练样本集中的每个训练样本的历史销量进行归一化处理。
本申请实施例中,销量预测模型的训练装置1600,还包括订单数据生成模块1612、历史销售数据生成模块1613,其中:
订单数据生成模块1612,用于获取商品订单,对商品订单进行合并,生成任一品类的订单数据;
历史销售数据生成模块1613,用于对任一品类的订单数据进行关键字段提取,对提取的关键字段对应的数据进行组合,生成任一品类的历史销售数据。
本申请实施例中,量预测模型的训练装置1600,还包括销量获取模块1614、清除模块1615,其中:
销量获取模块1614,用于根据任一品类的历史销售数据,确定任一品类在设定时长内的销量;
清除模块1615,用于响应于设定时长内的销量小于预设销量阈值,则清除任一品类的历史销售数据。
本申请实施例中,订单数据生成模块1612,包括:
订单信息获取单元16121,用于获取商品订单的生成时刻和商品品类;
候选商品订单确定单元16122,用于确定商品品类与任一品类一致的第一候选商品订单;
订单确定单元16123,用于针对任一品类,根据第一候选商品订单的生成时刻,确定属于同一时间段内的商品订单;
订单数据生成单元16124,用于将属于同一时间段内的商品订单进行合并,以生成任一品类的订单数据。
本申请实施例中,订单数据生成模块1612,还包括:
订单信息获取单元16121,进一步用于获取商品订单对应的商品品类和品类等级;
候选商品订单确定单元16122,进一步用于根据商品品类,确定属于任一品类的第二候选商品订单;
订单确定单元16123,进一步用于获取任一品类的目标品类等级,并滤除品类等级高于目标品类等级的第二候选商品订单;
订单数据生成单元16124,进一步用于对剩余的第二候选商品订单进行合并,以生成任一品类的订单数据。
本申请实施例中,第二训练样本集生成模块163,包括:
数量获取单元1631,用于获取第二历史销售数据的数量;
候选商品获取单元1632,用于响应于数量低于预设数量,获取与目标商品相似的候选商品;
数量补充单元1633,用于选取候选商品的历史销售数据,补充为第二历史销售数据。
本申请实施例中,销量预测模型的训练装置1600,还包括第三历史销售数据获取模块1616、时间特征获取模块1617、测试模块1618,其中:
第三历史销售数据获取模块1616,用于获取目标商品的第三历史销售数据;
时间特征获取模块1617,用于获取待预测时间点的时间特征;
测试模块1618,用于将第三历史销售数据和待预测时间点的时间特征,输入目标销量预测模型中,输出目标商品在待预测时间点上的预测销量。
本申请提出的销量预测模型的训练装置,获取第一历史销售数据,生成第一训练样本集,基于第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型。将目标基础销量预测模型进行备份,以避免各目标商品对应的模型调整之间的互相干扰。获取目标商品的第二历史销售数据,生成第二训练样本集,基于第二训练样本集对目标基础销量预测模型进行调整,生成目标商品对应的目标销量预测模型,生成目标商品对应的目标销量预测模型后,获取第三历史数据,完成对目标商品对应的目标销量预测模型的训练结果的测试。本申请中,生成的全品类对应的高精准的目标基础销量预测模型,可作为每个单品类商品对应的目标销量预测模型的基础预测模型,根据每个单品类商品的不同,实现了对于具有小样本历史销售数据特征的单品类目标商品的销量预测,同时,作为基础的全品类对应的目标基础销量预测模型具有高精准的预测功能,使得具有小样本历史销售数据特征的单品类目标商品的销量预测的准确度和精准度得到了有效的保证。
为达到上述实施例,本申请还提出了一种电子设备、一种计算机可读存储介质和一种计算机程序产品。
图17示出了可以用来实施本申请的实施例的示例电子设备1700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图17所示,设备1700包括存储器171、处理器172及存储在存储171上并可在处理器172上运行的计算机程序,处理器172执行程序指令时,实现上述实施例提出的销量预测模型的训练方法。
本申请实施例提出的电子设备,通过处理器172执行存储在存储器111上的计算机程序,获取第一历史销售数据,生成第一训练样本集,基于第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型。将目标基础销量预测模型进行备份,以避免各目标商品对应的模型调整之间的互相干扰。获取目标商品的第二历史销售数据,生成第二训练样本集,基于第二训练样本集对目标基础销量预测模型进行调整,生成目标商品对应的目标销量预测模型,生成目标商品对应的目标销量预测模型后,获取第三历史数据,完成对目标商品对应的目标销量预测模型的训练结果的测试。本申请中,生成的全品类对应的高精准的目标基础销量预测模型,可作为每个单品类商品对应的目标销量预测模型的基础预测模型,根据每个单品类商品的不同,实现了对于具有小样本历史销售数据特征的单品类目标商品的销量预测,同时,作为基础的全品类对应的目标基础销量预测模型具有高精准的预测功能,使得具有小样本历史销售数据特征的单品类目标商品的销量预测的准确度和精准度得到了有效的保证。
本申请实施例提出的一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器172执行时,实现上述实施例提出的销量预测模型的训练方法。
本申请实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,通过处理器172执行存储在存储器171上的计算机程序,获取第一历史销售数据,生成第一训练样本集,基于第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型。将目标基础销量预测模型进行备份,以避免各目标商品对应的模型调整之间的互相干扰。获取目标商品的第二历史销售数据,生成第二训练样本集,基于第二训练样本集对目标基础销量预测模型进行调整,生成目标商品对应的目标销量预测模型,生成目标商品对应的目标销量预测模型后,获取第三历史数据,完成对目标商品对应的目标销量预测模型的训练结果的测试。本申请中,生成的全品类对应的高精准的目标基础销量预测模型,可作为每个单品类商品对应的目标销量预测模型的基础预测模型,根据每个单品类商品的不同,实现了对于具有小样本历史销售数据特征的单品类目标商品的销量预测,同时,作为基础的全品类对应的目标基础销量预测模型具有高精准的预测功能,使得具有小样本历史销售数据特征的单品类目标商品的销量预测的准确度和精准度得到了有效的保证。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本身的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端服务器关系的计算机程序来产生客户端和服务器的关系。服务端可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(“VirtualPrivate Server”,或简称“VPS”)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合区块链的服务器。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (25)
1.一种销量预测模型的训练方法,其特征在于,包括:
采集多个品类商品的第一历史销售数据,并基于所述第一历史销售数据,生成第一训练样本集;
基于所述第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型;
采集目标商品的第二历史销售数据,并基于所述第二历史销售数据,生成所述目标商品的第二训练样本集;
基于所述第二训练样本集,对所述目标基础销量预测模型进行调整,以生成所述目标商品对应的目标销量预测模型。
2.根据权利要求1所述的销量预测模型的训练方法,其特征在于,所述基于所述第二训练样本集,对所述目标基础销量预测模型进行调整,包括:
对所述目标基础销量预测模型进行备份;
基于所述第二训练样本集,对备份的所述目标基础销量预测模型进行调整,生成所述目标商品对应的目标销量预测模型。
3.根据权利要求1所述的销量预测模型的训练方法,其特征在于,采用如下方式生成训练样本集:
基于预设的滑动窗口,从采集的历史销售数据中提取出N个时间点对应的所述历史销售数据;
提取第N+1个时间点的时间特征和所述N+1个时间点的实际销量;
将所述N个时间点的所述历史销售数据、所述N+1个时间点的时间特征和所述N+1个时间点的实际销量作为所述训练样本集中的一组训练样本,并继续滑动所述滑动窗口至预设滑动次数,以生成所述训练样本集。
4.根据权利要求3所述的销量预测模型的训练方法,其特征在于,还包括:
获取所述N+1个时间点的时间属性信息;
基于所述时间属性信息,对所述N+1个时间点进行编码,生成所述N+1个时间点的时间特征。
5.根据权利要求3所述的销量预测模型的训练方法,其特征在于,还包括:
从所述训练样本集中提取最大历史销量和最小历史销量;
根据所述最大历史销量和所述最小历史销量,对所述训练样本集中的每个训练样本的历史销量进行归一化处理。
6.根据权利要求1所述的销量预测模型的训练方法,其特征在于,采用如下方式生成历史销售数据:
获取商品订单,对所述商品订单进行合并,生成任一品类的订单数据;
对所述任一品类的订单数据进行关键字段提取,对提取的所述关键字段对应的数据进行组合,生成所述任一品类的历史销售数据。
7.根据权利要求6所述的销量预测模型的训练方法,其特征在于,所述生成所述任一品类的历史销售数据之后,还包括:
根据所述任一品类的历史销售数据,确定所述任一品类在设定时长内的销量;
响应于所述设定时长内的销量小于预设销量阈值,则清除所述任一品类的历史销售数据。
8.根据权利要求6所述的销量预测模型的训练方法,其特征在于,所述对所述商品订单进行合并,生成任一品类的订单数据,包括:
获取所述商品订单的生成时刻和商品品类;
确定所述商品品类与所述任一品类一致的第一候选商品订单;
针对所述任一品类,根据所述第一候选商品订单的生成时刻,确定属于同一时间段内的商品订单;
将属于所述同一时间段内的商品订单进行合并,以生成所述任一品类的订单数据。
9.根据权利要求6所述的销量预测模型的训练方法,其特征在于,所述对所述商品订单进行合并,生成所述任一品类的订单数据,包括:
获取所述商品订单对应的商品品类和品类等级;
根据所述商品品类,确定属于所述任一品类的第二候选商品订单;
获取所述任一品类的目标品类等级,并滤除所述品类等级高于所述目标品类等级的第二候选商品订单;
对剩余的所述第二候选商品订单进行合并,以生成所述任一品类的订单数据。
10.根据权利要求1或6所述的销量预测模型的训练方法,其特征在于,所述采集目标商品的第二历史销售数据,包括:
获取所述第二历史销售数据的数量;
响应于所述数量低于预设数量,获取与所述目标商品相似的候选商品;
选取所述候选商品的历史销售数据,补充为所述第二历史销售数据。
11.根据权利要求1所述的销量预测模型的训练方法,其特征在于,所述生成所述目标商品对应的目标销量预测模型之后,还包括:
获取所述目标商品的第三历史销售数据;
获取待预测时间点的时间特征;
将所述第三历史销售数据和所述待预测时间点的时间特征,输入所述目标销量预测模型中,输出所述目标商品在所述待预测时间点上的预测销量。
12.一种销量预测模型的训练装置,其特征在于,包括:
第一训练样本集生成模块,用于采集多个品类商品的第一历史销售数据,并基于所述第一历史销售数据,生成第一训练样本集;
模型训练模块,用于基于所述第一训练样本集对基础销量预测模型进行训练,生成目标基础销量预测模型;
第二训练样本集生成模块,用于采集目标商品的第二历史销售数据,并基于所述第二历史销售数据,生成所述目标商品的第二训练样本集;
模型调整模块,用于基于所述第二训练样本集,对所述目标基础销量预测模型进行调整,以生成所述目标商品对应的目标销量预测模型。
13.根据权利要求12所述的销量预测模型的训练装置,其特征在于,所述模型调整模块,包括:
备份单元,用于对所述目标基础销量预测模型进行备份;
模型调整单元,用于基于所述第二训练样本集,对备份的所述目标基础销量预测模型进行调整,生成所述目标商品对应的目标销量预测模型。
14.根据权利要求12所述的销量预测模型的训练装置,其特征在于,还包括:
销售数据获取模块,用于基于预设的滑动窗口,从采集的历史销售数据中提取出N个时间点对应的所述历史销售数据;
提取模块,用于提取第N+1个时间点的时间特征和所述N+1个时间点的实际销量;
训练样本集生成模块,用于将所述N个时间点的所述历史销售数据、所述N+1个时间点的时间特征和所述N+1个时间点的实际销量作为所述训练样本集中的一组训练样本,并继续滑动所述滑动窗口至预设滑动次数,以生成所述训练样本集。
15.根据权利要求14所述的销量预测模型的训练装置,其特征在于,还包括:
时间属性信息获取模块,用于获取所述N+1个时间点的时间属性信息;
编码模块,用于基于所述时间属性信息,对所述N+1个时间点进行编码,生成所述N+1个时间点的时间特征。
16.根据权利要求14所述的销量预测模型的训练装置,其特征在于,还包括:
边缘销量提取模块,用于从所述训练样本集中提取最大历史销量和最小历史销量;
归一化处理模块,用于根据所述最大历史销量和所述最小历史销量,对所述训练样本集中的每个训练样本的历史销量进行归一化处理。
17.根据权利要求12所述的销量预测模型的训练装置,其特征在于,还包括:
订单数据生成模块,用于获取商品订单,对所述商品订单进行合并,生成任一品类的订单数据;
历史销售数据生成模块,用于对所述任一品类的订单数据进行关键字段提取,对提取的所述关键字段对应的数据进行组合,生成所述任一品类的历史销售数据。
18.根据权利要求17所述的销量预测模型的训练装置,其特征在于,还包括:
销量获取模块,用于根据所述任一品类的历史销售数据,确定所述任一品类在设定时长内的销量;
清除模块,用于响应于所述设定时长内的销量小于预设销量阈值,则清除所述任一品类的历史销售数据。
19.根据权利要求17所述的销量预测模型的训练装置,其特征在于,所述订单数据生成模块,包括:
订单信息获取单元,用于获取所述商品订单的生成时刻和商品品类;
候选商品订单确定单元,用于确定所述商品品类与所述任一品类一致的第一候选商品订单;
订单确定单元,用于针对所述任一品类,根据所述第一候选商品订单的生成时刻,确定属于同一时间段内的商品订单;
订单数据生成单元,用于将属于所述同一时间段内的商品订单进行合并,以生成所述任一品类的订单数据。
20.根据权利要求17所述的销量预测模型的训练装置,其特征在于,所述订单数据生成模块,包括:
订单信息获取单元,进一步用于获取所述商品订单对应的商品品类和品类等级;
候选商品订单确定单元,进一步用于根据所述商品品类,确定属于所述任一品类的第二候选商品订单;
订单确定单元,进一步用于获取所述任一品类的目标品类等级,并滤除所述品类等级高于所述目标品类等级的第二候选商品订单;
订单数据生成单元,进一步用于对剩余的所述第二候选商品订单进行合并,以生成所述任一品类的订单数据。
21.根据权利要求12或17所述的销量预测模型的训练装置,其特征在于,所述第二训练样本集生成模块,包括:
数量获取单元,用于获取所述第二历史销售数据的数量;
候选商品获取单元,用于响应于所述数量低于预设数量,获取与所述目标商品相似的候选商品;
数量补充单元,用于选取所述候选商品的历史销售数据,补充为所述第二历史销售数据。
22.根据权利要求12所述的销量预测模型的训练装置,其特征在于,还包括:
第三历史销售数据获取模块,用于获取所述目标商品的第三历史销售数据;
时间特征获取模块,用于获取待预测时间点的时间特征;
测试模块,用于将所述第三历史销售数据和所述待预测时间点的时间特征,输入所述目标销量预测模型中,输出所述目标商品在所述待预测时间点上的预测销量。
23.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-11中任一项所述的用方法。
24.一种计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-11中任一项所述的方法。
25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110242143.3A CN113723985A (zh) | 2021-03-04 | 2021-03-04 | 销量预测模型的训练方法、装置及电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110242143.3A CN113723985A (zh) | 2021-03-04 | 2021-03-04 | 销量预测模型的训练方法、装置及电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113723985A true CN113723985A (zh) | 2021-11-30 |
Family
ID=78672540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110242143.3A Pending CN113723985A (zh) | 2021-03-04 | 2021-03-04 | 销量预测模型的训练方法、装置及电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723985A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114004425A (zh) * | 2021-12-29 | 2022-02-01 | 北京京东振世信息技术有限公司 | 物品流转信息预测模型生成方法、信息生成方法、装置 |
CN114049162A (zh) * | 2022-01-11 | 2022-02-15 | 北京京东振世信息技术有限公司 | 模型训练方法、需求量预测方法、装置、设备和存储介质 |
CN114581157A (zh) * | 2022-04-28 | 2022-06-03 | 湖南康道医药有限公司 | 基于大数据的销量预测方法、装置、电子设备及介质 |
CN114757722A (zh) * | 2022-06-09 | 2022-07-15 | 荣耀终端有限公司 | 一种电子设备的销量预测方法和装置 |
CN114757700A (zh) * | 2022-04-12 | 2022-07-15 | 北京京东尚科信息技术有限公司 | 物品销量预测模型训练方法、物品销量预测方法及装置 |
CN115879992A (zh) * | 2022-11-21 | 2023-03-31 | 杭州巨灵兽智能科技有限公司 | 生鲜供应链布局方法、装置、计算机设备及存储介质 |
CN116541449A (zh) * | 2023-05-12 | 2023-08-04 | 河南铭视科技股份有限公司 | 一种烟草多源异构数据的集成分析方法及系统 |
CN117314516A (zh) * | 2023-09-19 | 2023-12-29 | 深圳市通商宝科技有限公司 | 一种数字卡券的管理方法以及系统 |
CN117349344A (zh) * | 2023-10-23 | 2024-01-05 | 广州欧派创意家居设计有限公司 | 一种基于大数据的产品销售数据智能采集方法及系统 |
CN117436936A (zh) * | 2023-12-19 | 2024-01-23 | 湖南兴盛优选电子商务有限公司 | 基于销量预测与bom成品加工系统及方法 |
CN118229343A (zh) * | 2024-05-23 | 2024-06-21 | 广东车卫士信息科技有限公司 | Saas平台管理方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932636A (zh) * | 2018-07-05 | 2018-12-04 | 上海信颐信息技术有限公司 | 一种商品零售预测方法及设备 |
CN109509030A (zh) * | 2018-11-15 | 2019-03-22 | 北京旷视科技有限公司 | 销量预测方法及其模型的训练方法、装置和电子系统 |
CN110599234A (zh) * | 2019-08-13 | 2019-12-20 | 广东工业大学 | 一种产品销售预测方法 |
CN111401941A (zh) * | 2020-03-06 | 2020-07-10 | 武汉大学 | 一种基于XGBoost推荐算法的车辆销量预测方法 |
CN111652657A (zh) * | 2020-06-10 | 2020-09-11 | 创新奇智(南京)科技有限公司 | 商品销量预测方法、装置、电子设备及可读存储介质 |
-
2021
- 2021-03-04 CN CN202110242143.3A patent/CN113723985A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932636A (zh) * | 2018-07-05 | 2018-12-04 | 上海信颐信息技术有限公司 | 一种商品零售预测方法及设备 |
CN109509030A (zh) * | 2018-11-15 | 2019-03-22 | 北京旷视科技有限公司 | 销量预测方法及其模型的训练方法、装置和电子系统 |
CN110599234A (zh) * | 2019-08-13 | 2019-12-20 | 广东工业大学 | 一种产品销售预测方法 |
CN111401941A (zh) * | 2020-03-06 | 2020-07-10 | 武汉大学 | 一种基于XGBoost推荐算法的车辆销量预测方法 |
CN111652657A (zh) * | 2020-06-10 | 2020-09-11 | 创新奇智(南京)科技有限公司 | 商品销量预测方法、装置、电子设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
赵凯琳 等: "小样本学习研究综述", 《软件学报》, vol. 32, no. 2, 10 September 2020 (2020-09-10), pages 349 - 369 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114004425A (zh) * | 2021-12-29 | 2022-02-01 | 北京京东振世信息技术有限公司 | 物品流转信息预测模型生成方法、信息生成方法、装置 |
CN114049162A (zh) * | 2022-01-11 | 2022-02-15 | 北京京东振世信息技术有限公司 | 模型训练方法、需求量预测方法、装置、设备和存储介质 |
CN114757700A (zh) * | 2022-04-12 | 2022-07-15 | 北京京东尚科信息技术有限公司 | 物品销量预测模型训练方法、物品销量预测方法及装置 |
CN114581157A (zh) * | 2022-04-28 | 2022-06-03 | 湖南康道医药有限公司 | 基于大数据的销量预测方法、装置、电子设备及介质 |
CN114581157B (zh) * | 2022-04-28 | 2022-11-04 | 湖南康道医药有限公司 | 基于大数据的销量预测方法、装置、电子设备及介质 |
CN114757722A (zh) * | 2022-06-09 | 2022-07-15 | 荣耀终端有限公司 | 一种电子设备的销量预测方法和装置 |
CN114757722B (zh) * | 2022-06-09 | 2023-11-14 | 荣耀终端有限公司 | 一种电子设备的销量预测方法和装置 |
CN115879992A (zh) * | 2022-11-21 | 2023-03-31 | 杭州巨灵兽智能科技有限公司 | 生鲜供应链布局方法、装置、计算机设备及存储介质 |
CN116541449B (zh) * | 2023-05-12 | 2023-10-13 | 河南铭视科技股份有限公司 | 一种烟草多源异构数据的集成分析方法及系统 |
CN116541449A (zh) * | 2023-05-12 | 2023-08-04 | 河南铭视科技股份有限公司 | 一种烟草多源异构数据的集成分析方法及系统 |
CN117314516A (zh) * | 2023-09-19 | 2023-12-29 | 深圳市通商宝科技有限公司 | 一种数字卡券的管理方法以及系统 |
CN117349344A (zh) * | 2023-10-23 | 2024-01-05 | 广州欧派创意家居设计有限公司 | 一种基于大数据的产品销售数据智能采集方法及系统 |
CN117349344B (zh) * | 2023-10-23 | 2024-03-05 | 广州欧派创意家居设计有限公司 | 一种基于大数据的产品销售数据智能采集方法及系统 |
CN117436936A (zh) * | 2023-12-19 | 2024-01-23 | 湖南兴盛优选电子商务有限公司 | 基于销量预测与bom成品加工系统及方法 |
CN117436936B (zh) * | 2023-12-19 | 2024-05-17 | 湖南兴盛优选电子商务有限公司 | 基于销量预测与bom成品加工系统及方法 |
CN118229343A (zh) * | 2024-05-23 | 2024-06-21 | 广东车卫士信息科技有限公司 | Saas平台管理方法、装置、电子设备及存储介质 |
CN118229343B (zh) * | 2024-05-23 | 2024-07-23 | 广东车卫士信息科技有限公司 | Saas平台管理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113723985A (zh) | 销量预测模型的训练方法、装置及电子设备、存储介质 | |
CN109509030B (zh) | 销量预测方法及其模型的训练方法、装置和电子系统 | |
US8631040B2 (en) | Computer-implemented systems and methods for flexible definition of time intervals | |
US11372896B2 (en) | Method and apparatus for grouping data records | |
CN106933956B (zh) | 数据挖掘方法和装置 | |
US10748193B2 (en) | Assessing probability of winning an in-flight deal for different price points | |
CN113553540A (zh) | 一种商品销量的预测方法 | |
CN104951446A (zh) | 大数据处理方法及平台 | |
US20210182900A1 (en) | Augmenting missing values in historical or market data for deals | |
CN111144950B (zh) | 模型筛选方法、装置、电子设备及存储介质 | |
KR101435096B1 (ko) | 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법 | |
CN111352976B (zh) | 一种针对购物节的搜索广告转化率预测方法及装置 | |
WO2021072128A1 (en) | Systems and methods for big data analytics | |
CN111752935A (zh) | 一种电力交易用户数据稽查方法及装置 | |
US10902446B2 (en) | Top-down pricing of a complex service deal | |
CN115423555A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
Allegue et al. | RFMC: a spending-category segmentation | |
CN113065911A (zh) | 推荐信息生成方法、装置、存储介质及电子设备 | |
EP3489838A1 (en) | Method and apparatus for determining an association | |
CN115858291A (zh) | 一种系统指标的检测方法、装置、电子设备及其存储介质 | |
CN114925919A (zh) | 业务资源处理方法、装置、计算机设备和存储介质 | |
CN114358879A (zh) | 一种基于大数据的物价实时监测方法和系统 | |
CN110413967B (zh) | 对账图表生成方法、装置、计算机设备以及存储介质 | |
JP7211499B2 (ja) | 情報処理システム、情報処理装置、情報処理方法及びプログラム | |
CN114066564A (zh) | 服务推荐时间确定方法、装置、计算机设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |