CN114971748B - 预测数据生成、模型训练方法、计算机设备以及存储介质 - Google Patents

预测数据生成、模型训练方法、计算机设备以及存储介质 Download PDF

Info

Publication number
CN114971748B
CN114971748B CN202210888541.7A CN202210888541A CN114971748B CN 114971748 B CN114971748 B CN 114971748B CN 202210888541 A CN202210888541 A CN 202210888541A CN 114971748 B CN114971748 B CN 114971748B
Authority
CN
China
Prior art keywords
data
sales
time
sales data
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210888541.7A
Other languages
English (en)
Other versions
CN114971748A (zh
Inventor
贾文笑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ali Health Technology China Co ltd
Original Assignee
Ali Health Technology China Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ali Health Technology China Co ltd filed Critical Ali Health Technology China Co ltd
Priority to CN202210888541.7A priority Critical patent/CN114971748B/zh
Publication of CN114971748A publication Critical patent/CN114971748A/zh
Application granted granted Critical
Publication of CN114971748B publication Critical patent/CN114971748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施方式提供一种预测数据生成、模型训练方法、计算机设备以及存储介质。该方法通过对目标对象在指定时间区间内历史销售数据进行特征提取,得到历史销售数据的时序特征,对历史销售数据中时间连续的部分销售数据进行特征提取,得到部分销售数据的局部特征,通过时序特征反映特征维度上的时序数据在所述指定时间区间内的时间依赖关系,通过局部特征反映所述多个特征维度之间的关联关系,实现时间依赖特征与变量关联特征的共同捕捉,解决了传统技术中销量预测模型的捕捉关联特征的缺陷,进一步地,利用时序特征和局部特征共同生成目标对象的销量预测数据,提升销量预测结果的准确性。

Description

预测数据生成、模型训练方法、计算机设备以及存储介质
技术领域
本说明书实施方式涉及计算机技术领域,具体涉及一种预测数据生成、模型训练方法、计算机设备以及存储介质。
背景技术
供应链管理所面对的挑战包括供应链各个环节中的种种不确定性,尤其是需求侧的不确定性。需求侧的不确定性影响着整个计划和执行链路上的其他决策。因此,供应链管理者需要准确地预测未来需求的波动,从而协调企业内外资源来共同满足消费者需求。
近年来,随着机器学习的发展,供应链管理者开始使用一些基于统计学或者机器学习模型的算法工具,利用这些算法工具进行销量预测。然而,通过这些算法工具得到的销量预测结果的准确性有待提升。
发明内容
有鉴于此,本说明书实施方式致力于提供一种预测数据生成、模型训练方法、计算机设备以及存储介质,以提升销量数据的准确性。
本说明书实施方式提供了一种销量预测数据生成方法,所述方法包括:获取目标对象在指定时间区间内历史销售数据的时序特征;其中,所述历史销售数据具有多个特征维度;所述历史销售数据包括所述多个特征维度上的时序数据;所述时序特征用于表征所述特征维度上的时序数据在所述指定时间区间内的时间依赖关系;根据所述历史销售数据中时间连续的部分销售数据,得到所述部分销售数据的局部特征;其中,所述局部特征用于表征所述多个特征维度之间的关联关系;基于所述时序特征和所述局部特征生成所述目标对象的销量预测数据。
本说明书实施方式提供一种销量预测模型训练方法,所述方法包括:构建针对目标对象的训练样本集;其中,所述训练样本集包括多个训练样本;所述训练样本采用所述目标对象在指定时间区间内历史销售数据;所述历史销售数据具有多个特征维度;所述训练样本包括所述多个特征维度上的时序数据;利用所述训练样本集对初始预测模型进行训练,得到销量预测模型;其中,所述销量预测模型包括编码器和解码器;其中,所述编码器包括并行的卷积神经网络和循环神经网络;其中,所述循环神经网络用于获取所述历史销售数据的时序特征;所述卷积神经网络用于根据所述历史销售数据中时间连续的部分销售数据,得到所述部分销售数据的局部特征;所述解码器,用于基于所述时序特征和所述局部特征生成所述目标对象的销量预测数据;其中,所述时序特征用于表征所述特征维度上的时序数据在所述指定时间区间内的时间依赖关系;所述局部特征用于表征所述多个特征维度之间的关联关系。
本说明书实施方式提供一种销量预测数据生成装置,所述装置包括:时序特征获取模块,获取目标对象在指定时间区间内历史销售数据的时序特征;其中,所述历史销售数据具有多个特征维度;所述历史销售数据包括所述多个特征维度上的时序数据;所述时序特征用于表征所述特征维度上的时序数据在所述指定时间区间内的时间依赖关系;局部特征提取模块,用于根据所述历史销售数据中时间连续的部分销售数据,得到所述部分销售数据的局部特征;其中,所述局部特征用于表征所述多个特征维度之间的关联关系;销量数据生成模块,用于基于所述时序特征和所述局部特征生成所述目标对象的销量预测数据。
本说明书实施方式提供一种销量预测模型训练装置,所述装置包括:样本集构建模块,用于构建针对目标对象的训练样本集;其中,所述训练样本集包括多个训练样本;所述训练样本采用所述目标对象在指定时间区间内历史销售数据;所述历史销售数据具有多个特征维度;所述训练样本包括所述多个特征维度上的时序数据;预测模型训练模块,用于利用所述训练样本集对初始预测模型进行训练,得到销量预测模型;其中,所述销量预测模型包括编码器和解码器;其中,所述编码器包括并行的卷积神经网络和循环神经网络;其中,所述循环神经网络用于获取所述历史销售数据的时序特征;所述卷积神经网络用于根据所述历史销售数据中时间连续的部分销售数据,得到所述部分销售数据的局部特征;所述解码器,用于基于所述时序特征和所述局部特征生成所述目标对象的销量预测数据;其中,所述时序特征用于表征所述特征维度上的时序数据在所述指定时间区间内的时间依赖关系;所述局部特征用于表征所述多个特征维度之间的关联关系。
本说明书实施方式提供一种计算设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述实施方式中的方法步骤。
本说明书实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中的方法步骤。
本说明书实施方式提供一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行上述实施方式中的方法步骤。
本说明书实施方式,通过对目标对象在指定时间区间内历史销售数据进行特征提取,得到历史销售数据的时序特征,对历史销售数据中时间连续的部分销售数据进行特征提取,得到部分销售数据的局部特征,通过时序特征反映特征维度上的时序数据在所述指定时间区间内的时间依赖关系,通过局部特征反映所述多个特征维度之间的关联关系,实现时间依赖特征与变量关联特征的共同捕捉,解决了传统技术中销量预测模型的捕捉关联特征的缺陷,进一步地,利用时序特征和局部特征共同生成目标对象的销量预测数据,提升销量预测结果的准确性。
附图说明
图1所示为一实施方式提供的场景示例中网络环境的示意图。
图2所示为一实施方式提供的销量预测数据生成方法的流程示意图。
图3所示为一实施方式提供的销量预测数据生成方法的流程示意图。
图4所示为一实施方式提供的销量预测数据生成方法的流程示意图。
图5所示为一实施方式提供的销量预测数据生成方法的流程示意图。
图6a所示为一实施方式提供的销量预测模型训练方法的流程示意图。
图6b所示为一实施方式提供的MedFac模型的框架结构的示意图。
图7所示为一实施方式提供的销量预测数据生成装置的结构框图。
图8所示为一实施方式提供的销量预测模型训练装置的结构框图。
图9所示为一实施方式提供的计算机设备的内部结构图。
具体实施方式
下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本说明书保护的范围。
需要说明的是,本说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本说明书实施方式能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性地所描述的实施方式并不代表与本说明书实施方式相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书实施方式的一些方面相一致的装置和方法的例子。
还需要说明的是,本说明书和权利要求书所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
销量预测在供应链体系中扮演着越来越重要的角色。供应链管理结合销量预测数据制定针对商品或者资源的补货策略。通过准确的销量预测数据提升补货策略的精准性,提高商品或者资源的利用效率,减低成本浪费。示例性地,商品可以是药品、食品等产品。近年来,由于大量训练数据的可用性以及更强大和更高效的计算硬件的进步,机器学习普及率显著上升。机器学习可以利用被执行在一些电子商务、线下零售门店等场景中以提供预测数据的模型。例如,利用统计学或者机器学习模型的算法工具进行时间序列预测,然而,这些算法工具难以捕捉多特征维度上时序数据之间的相互关联关系,从而导致预测准确率有待提升。因此,本场景示例中提供一种销量预测模型训练方法,以及基于完成训练的销量预测模型生成销量预测数据的方法。
请参阅图1。网络环境包括电子设备110和服务器120。网络可以通信地(直接地或间接地)耦接电子设备110和/或服务器120。在一些实施方式中,网络106可以是可包括互联网或可通信地耦接到互联网的设备的互连网络。可以理解的是,网络环境在图1中示出为包括电子设备110和服务器120;然而,网络环境可包括任何数量的电子设备和任何数量的服务器。服务器120用于利用训练样本122对初始预测模型进行训练,得到销量预测模型124。服务器120发布销量预测模型124至电子设备110。
本场景示例中,以药品销量预测为例,服务器存储的数据包括药品的出库销量、渠道流量、转化率、价格、商品属性、促销优惠、满减、星期、月份、一年的第几周等多个初步特征维度上的数据。可以从服务器存储的数据的初步特征维度中选择部分或者全部的特征维度作为与销量预测有关的特征维度。利用目标药品在选择的特征维度上数据构建历史销售数据作为训练样本。具体地,可以确定训练样本的时间跨度,当数据的时间跨度过长可能导致过早的数据趋势和当前差别较大,当数据的时间跨度较短又可能导致没有统计意义,难以发现时序模式中的相互关系,综合考虑本场景示例中选取过去两周的数据作为训练样本。即训练样本可以采用目标药品在指定过去两周内的历史销售数据,历史销售数据具有多个特征维度。
示例性的,训练样本采用出库销量、渠道流量、转化率、价格、商品属性、促销优惠、星期、日期8个特征维度上的数据。且训练样本包括这8个特征维度上过去两周的时序数据,比如包括过去两周每天的出库销量构成的销量时序数据、过去两周每天的渠道流量构成的渠道流量时序数据、过去两周每天的转化率构成的转化率时序数据、过去两周每天的价格构成的价格时序数据、过去两周每天的商品属性构成的商品属性时序数据、过去两周每天的促销优惠构成的促销优惠时序数据、过去两周每天对应的星期时间单位构成的星期时序数据、过去两周每天对应的月份时间单位构成的月份时序数据。各个时间点上的数据记为Xt,t表示过去两周中的各时间点。比如第一个时间点为当前天,记为X1。第二个时间点为当前天的前一天,记为X2,以此类推。
本场景示例中,可以对商品属性特征维度上的数据进行嵌入编码,比如以embedding的方式构造商品属性数据。可以采用sin函数和cos函数对星期、日期等时间类型特征维度上的数据进行编码,可以使用sin/cos这对二元组进行表示。
本场景示例中,销量预测模型的框架主要包括编码器和解码器两部分。编码器可以采用并行的卷积神经网络和循环神经网络。在编码器的卷积神经网络、循环神经网络中分别引入不同的注意力机制。编码器的循环神经网络可以采用混合注意机制,利用混合注意机制使得编码器的循环神经网络同时学习特征维度重要性以及时间重要性。编码器的卷积神经网络可以加入了特征维度方向的注意力机制,可以强化重要特征维度上的数据、弱化非重要特征维度上的数据。
本场景示例中,编码器中的循环神经网络可以对历史销售数据进行特征提取,得到历史销售数据的时序特征。编码器中的卷积神经网络可以根据历史销售数据中时间连续的部分销售数据,得到部分销售数据的局部特征。其中,时序特征用于表征特征维度上的时序数据在指定时间区间内的时间依赖关系。局部特征用于表征多个特征维度之间的关联关系。
本场景示例中,解码器可以采用循环神经网络。其中,解码器的循环神经网络基于时序特征和局部特征生成目标对象的销量预测数据。对于单步预测场景,解码器的循环神经网通过一个全连接转换层对编码器输出的编码信息进行拼接,并经过神经网络单元进行预测,得到销量预测数据。对于多步预测场景,将前一时间点上的神经网络单元的预测值作为下一个时间点的输入,如此循环预测各时间点上的销量数据。需要说明的是,解码器所采用的循环神经网络与编码器的循环神经网络不同,并没有引入混合注意机制。
本场景示例中,在对模型进行评价时,对传统技术中的MAPE损失函数进行改进,在MAPE损失函数的分母中加入了预测值和一个很小的正数项,以避免真实销量为0导致模型无法收敛的情况。进一步地,为了模型预测的准确性,从多方面评价对模型进行评价,本场景示例中对比了三个损失函数,分别是Prec、MAPE和RMSE三个指标。
在基于损失函数的损失值或者其他确定达到满足模型停止训练条件的情况下,发布完成训练的销量预测模型。将目标药品用于销量预测的历史销售数据输入至销量预测模型中,得到目标药品的销量预测数据。
本场景示例中,可以将目标药品的销量预测数据发送至相关人员使用的终端,以可视化方式展示在相关人员使用的终端界面上,以提醒相关人员对销量预测数据进行人工判断,判断预测销量数据是否合理。在一些实施方式中,可以将预测销量数据提供至补货模型,补货模型基于预测销量数据确定目标药品的补货量,在判断目标药品的补货量合理的情况下,可以进行目标药品的备货,提升相关人员的工作效率。
本场景示例中,电子设备110可以是具有网络访问能力的电子设备。具体的,例如,客户端可以是台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、导购终端、电视机、智能音箱、麦克风等。其中,智能可穿戴设备包括但不限于智能手环、智能手表、智能眼镜、智能头盔、智能项链等。服务器120可以是具有一定运算处理能力的电子设备。其可以具有网络通信模块、处理器和存储器等。上述服务器120还可以为分布式服务器,可以是具有多个处理器、存储器、网络通信模块等协同运作的系统。或者,上述服务器120还可以为若干服务器形成的服务器集群。或者,随着科学技术的发展,上述服务器120还可以是能够实现说明书实施方式相应功能的新的技术手段。例如,可以是基于量子计算实现的新形态的“服务器”。
请参阅图2,本说明书实施方式提供一种销量预测数据生成方法。该销量预测数据生成方法应用于电子设备110,该销量预测数据生成方法可以包括以下步骤。
S210、获取目标对象在指定时间区间内历史销售数据的时序特征。
其中,历史销售数据具有多个特征维度。特征维度可以是用于描述历史销售数据所需要的参数类别,特征维度也可以理解为历史销售数据中的数值对应的变量名。比如特征维度可以销量、价格、优惠、商品属性、渠道流量、星期、日期、月份等中的至少一个。历史销售数据包括多个特征维度上的时序数据。特征维度上的时序数据可以是特征维度上的实际数据按其发生的时间先后顺序排列而成的数列。
在一些情况下,利用传统技术中的销量预测模型预测得到销量预测数据,但是该销量预测数据的准确率较低,对准确率较低进行分析,发现传统技术中的销量预测模型在特征提取方面存在缺陷。因此,本实施方式中,在需要生成针对任一商品的销量预测数据的情况下,将该任一商品作为目标对象。确定针对当前时间的过去一段时间(比如7天、14天、21天中的任一个),将该过去一段时间作为指定时间区间。获取目标对象在指定时间区间内历史销售数据,利用神经网络模型分析历史销售数据中特征维度上的时序数据,提取特征维度上的时序数据指定时间区间内的时间依赖关系,得到历史销售数据的时序特征。该时序特征用于表征特征维度上的时序数据在指定时间区间内的时间依赖关系。可以理解的是,“神经网络模型”是一种由大量的、简单的处理单元(即神经元)广泛地互相连接而形成的高度复杂的非线性动力学系统,属于一种通用机器学习算法。
S220、根据历史销售数据中时间连续的部分销售数据,得到部分销售数据的局部特征。
在一些情况下,经过进一步地分析发现传统技术中的销量预测模型在捕捉特征维度之间的相互关联特征时存在一些缺陷。而且历史销售数据的时序特征已经可以表示长时间序列的时序依赖关系,进一步地,还需捕捉短时间序列的局部特征。其中,历史销售数据包括在指定时间段内特征维度上的实际数据按其发生的时间先后顺序排列而成的时序数据。从指定时间段内获取时间连续的若干时间点的销售数据构成部分销售数据。通过分析部分销售数据确定短时间序列的局部特征。因此,对历史销售数据中时间连续的部分销售数据进行特征提取,得到部分销售数据的局部特征。局部特征用于表征多个特征维度之间的关联关系。
S230、基于时序特征和局部特征生成目标对象的销量预测数据。
其中,销量预测可以理解为利用历史销售数据预测未来一段时间内目标对象在指定时间(比如7天、14等)内的销量或者总销量。具体地,已经提取到内历史销售数据的时序特征和部分销售数据的局部特征,对时序特征和局部特征进行融合或者拼接,基于融合结果或者拼接结果进行预测,得到目标对象的销量预测数据。
示例性地,构建销量预测模型,销量预测模型包括编码器和解码器,编码器包括并行的第一分支和第二分支,解码器接收第一分支的输出以及第二分支的输出。具体地,将目标对象在指定时间区间内历史销售数据输入至第一分支中,得到历史销售数据的时序特征。将历史销售数据中时间连续的部分销售数据输入至第二分支中,得到部分销售数据的局部特征。将时序特征、局部特征输入至解码器中进行预测,得到目标对象的销量预测数据。
上述销量预测数据生成方法,通过对目标对象在指定时间区间内历史销售数据进行特征提取,得到历史销售数据的时序特征,对历史销售数据中时间连续的部分销售数据进行特征提取,得到部分销售数据的局部特征,通过时序特征反映特征维度上的时序数据在指定时间区间内的时间依赖关系,通过局部特征反映多个特征维度之间的关联关系,实现时间依赖特征与变量关联特征的共同捕捉,解决了传统技术中销量预测模型的捕捉关联特征的缺陷,进一步地,利用时序特征和局部特征共同生成目标对象的销量预测数据,提升销量预测结果的准确性。
在一些实施方式中,获取目标对象在指定时间区间内历史销售数据的时序特征,包括:将历史销售数据输入至循环神经网络中,得到时序特征。
其中,循环神经网络(Recurrent Neural Network,RNN)是一种用于处理序列数据的神经网络。在一些实施方式中,循环神经网络可以采用长短期记忆网络(Long Short-Term Memory,LSTM)。LSTM是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。相比普通的RNN,LSTM能够在更长的序列中有更好的表现。LSTM通过门控状态来控制传输状态,记住需要长时间记忆的,忘记不重要的信息。在一些实施方式中,可以采用GRU网络(Gate Recurrent Unit)。GRU(Gate Recurrent Unit)是也循环神经网络的一种。和LSTM(Long-Short Term Memory)一样,GRU也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。具体地,编码器的第一分支采用循环神经网络,将历史销售数据输入至循环神经网络中提取历史销售数据的时序特征。
上述实施方式中,利用循环神经网络提取历史销售数据的时序特征,得到长时间序列的时序依赖关系,为提升销量预测数据的准确性提供基础。
在一些实施方式中,请参阅图3,将历史销售数据输入至循环神经网络中,得到时序特征,可以包括以下步骤。
S310、利用长短期记忆网络对历史销售数据进行特征提取,得到隐层特征矩阵。
在一些情况下,循环神经网络由于不透明的隐层状态而无法满足对多变量数据的可解释性,循环神经网络会将所有变量的信息盲目地融合到用于预测的隐层状态中,因此,很难通过隐层状态序列区别各个变量对预测的共享,同时忽略了各变量在时间上的不同的动态性,从而影响预测性能,所以本实施方式基于LSTM的改进模型(Interpretable Multi-Variable LSTM,IMV-LSTM)进行特征提取。具体地,给定N个变量的序列数据,为了获得variable-wise的隐藏状态信息,将原本D维的隐层状态改为N*D维的隐层特征矩阵,其中,N为变量数量。N*D维的隐层特征矩阵意味着每个输入变量对应了一行隐层状态。
本实施方式中的LSTM依然有输入门、遗忘门和输出门,采用以下公式更新存储信息。
Figure 571981DEST_PATH_IMAGE001
其中,Wj表示线性变换的隐层权重,
Figure 295086DEST_PATH_IMAGE002
表示当前时间点t的上一时间点t-1的隐层输出,uj表示当前时间点t的线性变换权重,bj为偏差量。
S320、利用权重参数矩阵在时间维度和特征维度上对隐层特征矩阵进行加权处理,得到加权时序特征。
S330、利用特征维度上的第一权重参数对加权时序特征进行加权处理,得到时序特征。
其中,权重参数矩阵可以是长短期记忆网络中每个神经元的隐层输出在时间维度和特征维度上的注意力分配概率分布信息。第一权重参数可以是长短期记忆网络中每个神经元的隐层输出在特征维度上的注意力分配概率分布信息。
在一些情况下,在隐层状态的变维的基础至上,可以进一步地引入混合注意力机制,对每个变量对应的隐层状态序列施加时间注意,以获取每个变量的历史记录。然后,通过使用历史记录的每个变量的隐层状态,导出变量注意以合并变量状态,有助于后续的学习、预测和解释。
具体地,为长短期记忆网络提供注意力分配概率分布信息的注意力分配模块,注意力分配模块通过学习不同时间以及不同变量的历史销售数据对未来销量的重要程度,得到权重参数矩阵。利用权重参数矩阵对之前的隐层特征矩阵输出进行加权处理可以得到加权时序特征,以使用权重参数矩阵在时间维度和特征维度上删除或者减弱历史销售数据中各特征维度上的时序数据对预测结果的影响。为了进一步地明确历史销售数据的重要变量,增加重要变量对预测结果的影响,因此,注意力分配模块通过学习不同变量的历史销售数据对未来销量的重要程度,得到第一权重参数。利用第一权重参数对加权时序特征进行加权处理,得到时序特征。
上述实施方式中,通过利用长短期记忆网络对历史销售数据进行特征提取,得到隐层特征矩阵,并结合权重参数矩阵、第一权重参数进行两次加权处理,实现从时间方向和变量方向上引入注意力,在此基础上,进一步提升重要变量对预测结果的影响,提升预测结果的准确性。
在一些实施方式中,根据历史销售数据中时间连续的部分销售数据,得到部分销售数据的局部特征,可以包括:将部分销售数据输入至卷积神经网络中,得到局部特征。
其中,卷积神经网络(CNN,Convolutional NeuralNetwork包含了一个由卷积层和子采样层(池化层)构成的特征抽取器。在卷积神经网络的卷积层中,一个神经元与部分邻层神经元连接。具体地,输入编码器的第一分支的历史销售数据时间跨度长于输入编码器的第二分支的部分销售数据时间跨度,可以从历史销售数据对应的M个时间点中选取连续的N个时间点,利用选取的N个时间点上的销售数据构成部分销售数据。编码器的第二分支采用卷积神经网络,历史销售数据中时间连续的部分销售数据输入至卷积神经网络进行卷积处理,提取出来部分销售数据的局部特征。
示例性地,历史销售数据时间跨度为14天(每天看做一个时间点),则部分销售数据可以是历史销售数据对应的14天中的时间连续的7天的销售数据。比如,历史销售数据的时间跨度记为第一天至第十四天。则部分销售数据的时间跨度为第一天至第七天,可以为第二天至第八天,也可以是第七天至第十三天,还可以是第八天至第十四天,在此不再赘述。
上述实施方式中,利用卷积神经网络提取部分销售数据的时序特征,得到短时间序列的局部特征,为提升销量预测数据的准确性提供基础。
在一些实施方式中,请参阅图4,将部分销售数据输入至卷积神经网络中,得到局部特征,可以包括以下步骤。
S410、对部分销售数据进行一维卷积处理,得到部分销售数据的销售表征特征。
S420、基于部分销售数据对应的时间区间对销售表征特征进行池化处理,得到关联特征。
S430、利用特征维度上的第二权重参数对关联特征进行加权处理,得到局部特征。
具体地,为了对部分销售数据卷积处理后的维度保持不变,在卷积处理之前,对部分销售数据进行补齐操作,对补齐之后的部分销售数据进行一维卷积处理,得到与部分销售数据卷积维度相同的销售表征特征。为了在时间方向上对销售表征特征进行拍平处理,根据部分销售数据对应的时间区间确定部分销售数据的时间点数量,比如,利用部分销售数据的时间点数量对销售表征特征进行池化平均,得到部分销售数据在各特征维度上的关联特征。
进一步地,为卷积神经网络提供注意力分配概率分布信息的注意力分配模块。注意力分配模块通过学习不同特征维度的部分销售数据对未来销量的重要程度,得到第二权重参数。将第二权重参数与关联特征进行相乘,以对关联特征进行加权处理,得到部分销售数据的局部特征。
上述实施方式中,通过利用卷积神经网络对历史销售数据进行特征提取,得到关联特征,并结合第二权重参数、关联特征进行加权处理,实现在变量方向上引入注意力,把重要的变量特征强化,非重要的变量特征弱化,并利用卷积神经网络提取的短时间序列的局部特征补充循环神经网络的提取的长时间序列的是时间依赖关系,提升预测结果的转确定。
在一些实施方式中,基于时序特征和局部特征生成目标对象的销量预测数据,包括:对时序特征和局部特征进行拼接,得到历史销售数据的联合特征;将联合特征输入至解码器中进行解码,得到销量预测数据。
在一些情况下,由于编码器的第一分支输出的时序特征可以表征特征维度上的时序数据在指定时间区间内的时间依赖关系,以及编码器的第二分支输出的局部特征可以表征多个特征维度之间的关联关系,因此,为了提升预测准确性,可以采用拼接函数对历史销售数据的时序特征与部分销售数据的局部特征进行拼接,得到历史销售数据的联合特征。编码器连接有解码器,将历史销售数据的联合特征输入至解码器中进行解码,得到未来一个时间点或者未来多个时间点的销量预测数据。时间颗粒度可以是天。
具体地,通过循环输入和解码的方式预测预测未来时间区间各时间点上的销量数据。将历史销售数据的联合特征输入至解码器时,解码器可以进行解码得到未来时间区间中第一个时间点的隐层状态以及未来时间区间中第一个时间点的销量预测数据。对第一个时间点的隐层状态、第一个时间点的销量预测数据、历史销售数据的联合特征进行解码后即可得到未来时间区间中第二时间节点的隐层状态以及第二时间节点的销量预测数据,以此类推,直至未来时间区间中的最后一个时间点。将未来时间区间中各个时间节点的销量预测数据进行组合以得到预测销量序列数据。
上述实施方式中,利用局部特征对时序特征进行补充,关联特征能够更加准确反映历史销售数据,从而提升预测结果的准确性,为自动补货任务奠定良好的基础。
在一些实施方式中,解码器包括第一解码单元和与第一解码单元连接的第二解码单元;第一解码单元对应未来已知的第一时间点,第二解码单元对应未来已知的第二时间点。将联合特征输入至解码器中进行解码,得到销量预测数据,包括:将联合特征与第一时间点对应的第一时间数据输入至第一解码单元进行解码,得到第一时间点上的销量预测数据;将第一时间点上的销量预测数据、联合特征与第二时间点对应的第二时间数据输入至第二解码单元,得到第二时间点上的销量预测数据。
其中,解码器包括若干个解码单元,各解码单元依次连接。解码器可以采用长短期记忆神经网络。需要说明的是,解码器中采用的长短期记忆神经网络与编码器第一分支采用的长短期记忆神经网络在网络结构上可以不同。比如,解码器中采用的长短期记忆神经网络并不引入注意力分配模块。比如,解码器中采用的长短期记忆神经网络的隐层状态为D维的。
在一些情况下,针对未来可知的变量,比如未来各时间点对应的时间数据,未来某个时间点所对应的日期数据、星期数据、月份数据、季节数据等。可以将这些未来已知变量的部分或者全部作为各时间点上解码单元的输入。具体地,将联合特征、第一时间点对应的第一时间数据拼接,利用第一解码单元对拼接得到的特征进行编码,得到第一时间点上的销量预测数据以及隐层状态。将第一时间点上的销量预测数据以及隐层状态传输至第二时间点对应的第二解码单元。第一时间点上的销量预测数据、第一时间点上的隐层状态、联合特征以及第二时间点对应的第二时间数据进行拼接,利用第二解码单元对拼接得到的特征进行编码,得到第二时间点上的销量预测数据。将未来时间区间中各个时间节点的销量预测数据进行组合以得到预测销量序列数据。
上述实施方式中,利用引入未来已知变量,进一步地丰富解码器的输入特征,提升预测结果的合理性。
在一些实施方式中,历史销售数据的生成方式,包括:获取目标对象的初始历史销售数据;其中,初始历史销售数据包括销量特征维度上的初始销量数据序列。在检测到初始销量数据序列中任意时间点上存在异常的情况下,利用目标数据替换存在异常的时间点上的初始数据,得到历史销售数据;其中,目标数据是由初始销量数据序列中指定百分位点上的数据确定的。
在一些情况下,由于促销活动、天气、季节、流行病突然等原因,目标对象的销售数据在某些时间点存在明显的起跳现象,这些时间点上的销售数据视为异常。因此,需要这些时间点上的异常销售数据进行处理。具体地,可以从数据库中获取目标对象的初始历史销售数据,初始历史销售数据包括销量特征维度上的初始销量数据序列。比如初始销量数据序列可以是7天的销量数据,比如(500,400,1000,200,600,300,560),其中1000可以认为是异常情况。针对初始销量数据序列进行指定百分位点的计算,将指定百分位点上的数据确定初始销量数据序列的目标数据。针对大于目标数据的异常的时间点,利用目标数据替换存在异常的时间点上的初始数据,得到更新后的销量数据序列,销量数据序列作为历史销售数据中销量特征维度上的序列数据。示例性地,可以计算全局百分位点97%作为销量的最大值,大于该最大值的销量数据都被截断为该最大值。
本实施方式中,通过对初步历史销售数据进行预处理,减少数据异常对模型预测结果的影响。
在一些实施方式中,本说明书提供一种销量预测数据生成方法。请参阅图5,该销量预测数据生成方法可以包括以下步骤。
S502、将目标对象在指定时间区间内历史销售数据输入至循环神经网络中,得到历史销售数据的时序特征。
其中,历史销售数据具有多个特征维度;历史销售数据包括多个特征维度上的时序数据;时序特征用于表征特征维度上的时序数据在指定时间区间内的时间依赖关系,具体地,对历史销售数据进行特征提取,得到隐层特征矩阵;利用权重参数矩阵在时间维度和特征维度上对隐层特征矩阵进行加权处理,得到加权时序特征;利用特征维度上的第一权重参数对加权时序特征进行加权处理,得到时序特征。
S504、将历史销售数据中时间连续的部分销售数据输入至卷积神经网络中,得到局部特征。
具体地,对部分销售数据进行一维卷积处理,得到部分销售数据的销售表征特征;基于部分销售数据对应的时间区间对销售表征特征进行池化处理,得到关联特征;利用特征维度上的第二权重参数对关联特征进行加权处理,得到局部特征。
S506、对时序特征和局部特征进行拼接,得到历史销售数据的联合特征。
其中,解码器包括第一解码单元和与第一解码单元连接的第二解码单元;多个特征维度包括时间特征维度,在时间特征维度上存在未来已知的第一时间点和第二时间点。
S508、将联合特征与第一时间点对应的第一时间数据输入至第一解码单元进行解码,得到第一时间点上的销量预测数据。
S510、将第一时间点上的销量预测数据、联合特征与第二时间点对应的第二时间数据输入至第二解码单元,得到第二时间点上的销量预测数据。
请参阅图6a,本说明书实施方式提供一种销量预测模型训练方法。该销量预测模型训练方法可以包括以下步骤。
S610、构建针对目标对象的训练样本集。
其中,训练样本集包括多个训练样本;训练样本采用目标对象在指定时间区间内历史销售数据;历史销售数据具有多个特征维度;历史销售数据包括多个特征维度上的时序数据。
具体地,收集目标对象与销量有关的真实数据,与销量有关的真实数据包括许多维度。许多维度主要包含商品自身的指标类特征、营销活动的特征、时间特征。指标类特征包括出库销量、渠道流量、转化率、价格数据、商品属性。营销活动的特征包括各种满减、打折优惠等。时间特征包括星期、月份、一年的第几周这样的特征。从这许多维度中挑选出与销量预测有关的特征维度。将特征维度上的数据按照指定时间区间内的时间点先后顺序进行排序,构成训练样本。针对不同的指定时间区间构建不同的训练样本,形成训练样本集。训练样本集中包括有N个训练样本。示例性地,训练样本集中可以包括有1024个训练样本,训练样本集中可以包括有512个训练样本,训练样本集中也可以包括有256个训练样本。
S620、利用训练样本集对初始预测模型进行训练,得到销量预测模型。
其中,销量预测模型包括编码器和解码器;其中,编码器包括并行的卷积神经网络和循环神经网络;其中,循环神经网络用于获取历史销售数据的时序特征;卷积神经网络用于根据历史销售数据中时间连续的部分销售数据,得到部分销售数据的局部特征;解码器,用于基于时序特征和局部特征生成目标对象的销量预测数据;其中,时序特征用于表征特征维度上的时序数据在指定时间区间内的时间依赖关系;局部特征用于表征多个特征维度之间的关联关系。
具体地,将训练样本集中的训练样本输入至初始预测模型中。利用循环神经网络提取历史销售数据的时序特征,时序特征可以表征特征维度上的时序数据在指定时间区间内的时间依赖关系。利用卷积循环网络提取历史销售数据中时间连续的部分销售数据的局部特征;局部特征可以表征多个特征维度之间的关联关系。将时序特征与局部特征输入至编码器,得到目标对象的销量预测数据。
进一步地,基于训练样本的标签值和销量预测数据对模型进行评价。具体地,采用以下的损失函数对模型进行评价。
Figure 702934DEST_PATH_IMAGE003
其中,
Figure 994238DEST_PATH_IMAGE004
为真实值,
Figure 854746DEST_PATH_IMAGE005
为预测值,N为样本数,
Figure 256909DEST_PATH_IMAGE006
为一个极小的正数项。利用
Figure 519263DEST_PATH_IMAGE006
避免真实销量为0导致模型无法收敛的情况。
示例性地,本实施方式中搭建的销量预测模型可以称为MedFac(Multi-variableEncoder-Decoder Framework with Attention Conv-LSTM,基于注意力机制和卷积循环网络的多变量Encoder-Decoder框架)模型。图6b示出的是MedFac模型的框架结构。循环神经网络采用对LSTM改进后得到的IMV-LSTM。编码器采用普通的LSTM。其中,卷积神经网络中的B代表样本数量,C代表特征维度,T代表指定时间区间。循环神经网络中的Xt、Xt-1……Xt-n表示指定时间区间内的各时间点上的销售数据。解码器中Rt+1、Rt+2……Rt+n表示循环神经网络的输出。Ct+1、Ct+2……Ct+n表示循环神经网络的输出。Xt+1、Xt+2……Xt+n表示未来时间区间内的各时间点上的已知变量。Yt+1、Yt+2……Y+n表示未来时间区间内的各时间点上的销量预测时间。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
请参阅图7,本说明书实施方式提供了一种销量预测数据生成装置,销量预测数据生成装置包括:时序特征获取模块、局部特征提取模块、销量数据生成模块。
时序特征获取模块,获取目标对象在指定时间区间内历史销售数据的时序特征;其中,历史销售数据具有多个特征维度;历史销售数据包括多个特征维度上的时序数据;时序特征用于表征特征维度上的时序数据在指定时间区间内的时间依赖关系。
局部特征提取模块,用于根据历史销售数据中时间连续的部分销售数据,得到部分销售数据的局部特征;其中,局部特征用于表征多个特征维度之间的关联关系。
销量数据生成模块,用于基于时序特征和局部特征生成目标对象的销量预测数据。
关于销量预测数据生成装置的具体限定可以参见上文中对于销量预测数据生成方法的限定,在此不再赘述。上述销量预测数据生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
请参阅图8,本说明书实施方式提供了一种销量预测模型训练装置,销量预测模型训练装置包括:样本集构建模块、预测模型训练模块。
样本集构建模块,用于构建针对目标对象的训练样本集;其中,训练样本集包括多个训练样本;训练样本采用目标对象在指定时间区间内历史销售数据;历史销售数据具有多个特征维度;历史销售数据包括多个特征维度上的时序数据。
预测模型训练模块,用于利用训练样本集对初始预测模型进行训练,得到销量预测模型;其中,销量预测模型包括编码器和解码器;其中,编码器包括并行的卷积神经网络和循环神经网络;其中,循环神经网络用于获取历史销售数据的时序特征;卷积神经网络用于根据历史销售数据中时间连续的部分销售数据,得到部分销售数据的局部特征;解码器,用于基于时序特征和局部特征生成目标对象的销量预测数据;其中,时序特征用于表征特征维度上的时序数据在指定时间区间内的时间依赖关系;局部特征用于表征多个特征维度之间的关联关系。
关于销量预测模型训练装置的具体限定可以参见上文中对于销量预测模型训练方法的限定,在此不再赘述。上述销量预测模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一些实施方式中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现上述任一实施方式中的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本说明书所公开方案相关的部分结构的框图,并不构成对本说明书所公开方案所应用于其上的计算机设备的限定,具体地,计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施方式中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述实施方式中的方法步骤。
在一些实施方式中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施方式中的方法步骤。
在一些实施方式中,还提供一种计算机程序产品,所述计算机程序产品中包括指令,上述指令可由计算机设备的处理器执行时实现上述实施方式中的方法步骤。
本领域普通技术人员可以理解实现上述实施方式方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施方式的流程。其中,本说明所提供的各实施方式中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施方式的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施方式中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述仅为本说明书的较佳实施方式而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所作的任何修改、等同替换等,均应包含在本说明书的保护范围之内。

Claims (9)

1.一种销量预测数据生成方法,其特征在于,所述方法包括:
将目标对象在指定时间区间内历史销售数据输入至循环神经网络中,得到时序特征;其中,所述历史销售数据具有多个特征维度;所述历史销售数据包括所述多个特征维度上的时序数据;所述时序特征用于表征所述特征维度上的时序数据在所述指定时间区间内的时间依赖关系;
将所述历史销售数据中时间连续的部分销售数据输入至卷积神经网络中,得到所述部分销售数据的局部特征;其中,所述局部特征用于表征所述多个特征维度之间的关联关系;
基于所述时序特征和所述局部特征生成所述目标对象的销量预测数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述历史销售数据输入至循环神经网络中,得到所述时序特征,包括:
利用长短期记忆网络对所述历史销售数据进行特征提取,得到隐层特征矩阵;
利用权重参数矩阵在时间维度和特征维度上对所述隐层特征矩阵进行加权处理,得到加权时序特征;
利用所述特征维度上的第一权重参数对所述加权时序特征进行加权处理,得到所述时序特征。
3.根据权利要求1所述的方法,其特征在于,所述将所述部分销售数据输入至卷积神经网络中,得到所述局部特征,包括:
对所述部分销售数据进行一维卷积处理,得到所述部分销售数据的销售表征特征;
基于所述部分销售数据对应的时间区间对所述销售表征特征进行池化处理,得到关联特征;
利用所述特征维度上的第二权重参数对所述关联特征进行加权处理,得到所述局部特征。
4.根据权利要求1所述的方法,其特征在于,所述基于所述时序特征和所述局部特征生成所述目标对象的销量预测数据,包括:
对所述时序特征和所述局部特征进行拼接,得到所述历史销售数据的联合特征;
将所述联合特征输入至解码器中进行解码,得到所述销量预测数据。
5.根据权利要求4所述的方法,其特征在于,所述解码器包括第一解码单元和与所述第一解码单元连接的第二解码单元;所述第一解码单元对应未来已知的第一时间点,所述第二解码单元对应未来已知的第二时间点;所述将所述联合特征输入至解码器中进行解码,得到所述销量预测数据,包括:
将所述联合特征与所述第一时间点对应的第一时间数据输入至所述第一解码单元进行解码,得到所述第一时间点上的销量预测数据;
将所述第一时间点上的销量预测数据、所述联合特征与所述第二时间点对应的第二时间数据输入至所述第二解码单元,得到所述第二时间点上的销量预测数据。
6.根据权利要求1所述的方法,其特征在于,所述历史销售数据的生成方式,包括:
获取所述目标对象的初始历史销售数据;其中,所述初始历史销售数据包括所述多个特征维度上的初始时序数据;
在检测到所述初始时序数据中任意时间点上存在异常的情况下,利用目标数据替换存在异常的时间点上的初始数据,得到所述历史销售数据;其中,所述目标数据是由所述初始时序数据中指定百分位点上的数据确定的。
7.一种销量预测模型训练方法,其特征在于,所述方法包括:
构建针对目标对象的训练样本集;其中,所述训练样本集包括多个训练样本;所述训练样本采用所述目标对象在指定时间区间内历史销售数据;所述历史销售数据具有多个特征维度;所述历史销售数据包括所述多个特征维度上的时序数据;
利用所述训练样本集对初始预测模型进行训练,得到销量预测模型;其中,所述销量预测模型包括编码器和解码器;其中,所述编码器包括并行的卷积神经网络和循环神经网络;其中,所述循环神经网络用于获取所述历史销售数据的时序特征;所述卷积神经网络用于根据所述历史销售数据中时间连续的部分销售数据,得到所述部分销售数据的局部特征;所述解码器,用于基于所述时序特征和所述局部特征生成所述目标对象的销量预测数据;其中,所述时序特征用于表征所述特征维度上的时序数据在所述指定时间区间内的时间依赖关系;所述局部特征用于表征所述多个特征维度之间的关联关系。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202210888541.7A 2022-07-27 2022-07-27 预测数据生成、模型训练方法、计算机设备以及存储介质 Active CN114971748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210888541.7A CN114971748B (zh) 2022-07-27 2022-07-27 预测数据生成、模型训练方法、计算机设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210888541.7A CN114971748B (zh) 2022-07-27 2022-07-27 预测数据生成、模型训练方法、计算机设备以及存储介质

Publications (2)

Publication Number Publication Date
CN114971748A CN114971748A (zh) 2022-08-30
CN114971748B true CN114971748B (zh) 2022-11-01

Family

ID=82969102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210888541.7A Active CN114971748B (zh) 2022-07-27 2022-07-27 预测数据生成、模型训练方法、计算机设备以及存储介质

Country Status (1)

Country Link
CN (1) CN114971748B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115547475A (zh) * 2022-12-05 2022-12-30 医修技术服务(北京)有限公司 一种基于称重型医用耗材管理柜的智能自动控制方法
CN116777507B (zh) * 2023-06-23 2024-05-28 青岛中沃兴牧食品科技有限公司 一种基于lstm模型的猪肉专卖网点各类猪肉销售量的预测方法
CN116882902B (zh) * 2023-09-06 2023-11-07 酒仙网络科技股份有限公司 基于酒品购销信息的仓储管理优化方法、系统及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175637A (zh) * 2019-05-09 2019-08-27 北京工商大学 非平稳时序数据深度预测方法、系统、存储介质及设备
CN111445134A (zh) * 2020-03-26 2020-07-24 珠海随变科技有限公司 商品的销量预测方法、装置、计算机设备和存储介质
CN112766619A (zh) * 2021-04-07 2021-05-07 广东众聚人工智能科技有限公司 一种商品时序数据预测方法及系统
CN114565149A (zh) * 2022-02-23 2022-05-31 重庆邮电大学 一种基于cga融合模型的时间序列数据预测方法、装置及计算机设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832897A (zh) * 2017-11-30 2018-03-23 浙江工业大学 一种基于深度学习的股票市场预测方法
CN109885756B (zh) * 2018-12-18 2021-09-28 湖南大学 基于cnn和rnn的序列化推荐方法
CN109886747A (zh) * 2019-02-22 2019-06-14 网易(杭州)网络有限公司 销量预测方法、介质、装置和计算设备
US20220138537A1 (en) * 2020-11-02 2022-05-05 International Business Machines Corporation Probabilistic nonlinear relationships cross-multi time series and external factors for improved multivariate time series modeling and forecasting

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175637A (zh) * 2019-05-09 2019-08-27 北京工商大学 非平稳时序数据深度预测方法、系统、存储介质及设备
CN111445134A (zh) * 2020-03-26 2020-07-24 珠海随变科技有限公司 商品的销量预测方法、装置、计算机设备和存储介质
CN112766619A (zh) * 2021-04-07 2021-05-07 广东众聚人工智能科技有限公司 一种商品时序数据预测方法及系统
CN114565149A (zh) * 2022-02-23 2022-05-31 重庆邮电大学 一种基于cga融合模型的时间序列数据预测方法、装置及计算机设备

Also Published As

Publication number Publication date
CN114971748A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
Nguyen et al. Forecasting and Anomaly Detection approaches using LSTM and LSTM Autoencoder techniques with the applications in supply chain management
Shi et al. A spatial–temporal attention approach for traffic prediction
CN114971748B (zh) 预测数据生成、模型训练方法、计算机设备以及存储介质
Ouyang et al. Agricultural commodity futures prices prediction via long-and short-term time series network
Al-Sharif et al. A novel approach for predicting the spatial patterns of urban expansion by combining the chi-squared automatic integration detection decision tree, Markov chain and cellular automata models in GIS
Lang et al. Understanding consumer behavior with recurrent neural networks
Yong et al. A stock market trading system using deep neural network
US11087344B2 (en) Method and system for predicting and indexing real estate demand and pricing
CN112508265A (zh) 面向业务流程管理的时间与活动多任务预测方法及系统
US11501107B2 (en) Key-value memory network for predicting time-series metrics of target entities
CN111144950A (zh) 模型筛选方法、装置、电子设备及存储介质
US20230011954A1 (en) Device, method, and system for business plan management
CN115983497A (zh) 一种时序数据预测方法和装置、计算机设备、存储介质
CN116843216A (zh) 一种指标预警方法、装置、计算机设备及存储介质
Chien et al. Ensemble learning for demand forecast of After-Market spare parts to empower data-driven value chain and an empirical study
Guo et al. Learning and integration of adaptive hybrid graph structures for multivariate time series forecasting
Fu et al. MHieR-encoder: Modelling the high-frequency changes across stocks
US20200160200A1 (en) Method and System for Predictive Modeling of Geographic Income Distribution
CN110414690A (zh) 利用机器学习模型执行预测的方法及装置
Méndez et al. Using deep learning to detect anomalies in traffic flow
CN111177657B (zh) 需求确定方法、系统、电子设备及存储介质
US20200051175A1 (en) Method and System for Predicting and Indexing Probability of Financial Stress
Smith et al. Stock Closing Price and Trend Prediction with LSTM-RNN
Chandrasekaran et al. Uncertainty-Aware Functional Analysis for Electricity Consumption Prediction Using Multi-Task Optimization Learning Model
Krishna et al. Identifying Demand Forecasting using Machine Learning for Business Intelligence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant