CN114169914A - 用于物品销量预测的特征构建方法、装置和存储介质 - Google Patents

用于物品销量预测的特征构建方法、装置和存储介质 Download PDF

Info

Publication number
CN114169914A
CN114169914A CN202111360223.5A CN202111360223A CN114169914A CN 114169914 A CN114169914 A CN 114169914A CN 202111360223 A CN202111360223 A CN 202111360223A CN 114169914 A CN114169914 A CN 114169914A
Authority
CN
China
Prior art keywords
data
feature
characteristic data
feature data
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111360223.5A
Other languages
English (en)
Inventor
丁永兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chuangyou Digital Technology Guangdong Co Ltd
Original Assignee
Chuangyou Digital Technology Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chuangyou Digital Technology Guangdong Co Ltd filed Critical Chuangyou Digital Technology Guangdong Co Ltd
Priority to CN202111360223.5A priority Critical patent/CN114169914A/zh
Publication of CN114169914A publication Critical patent/CN114169914A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种用于物品销量预测的特征构建方法、装置、计算机设备和存储介质。所述方法包括:获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据;获取与当前时间段相关的历史时间段的影响因子的第二特征数据,以及基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据;根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。采用本方法能够使得构建出的特征具备时序性,从而使得构建出的特征能够很好地应用在物品销量预测领域。

Description

用于物品销量预测的特征构建方法、装置和存储介质
技术领域
本申请涉及物品销量处理技术领域,特别是涉及一种用于物品销量预测的特征构建方法、装置、计算机设备和存储介质。
背景技术
对于人工智能领域,数据和特征决定了人工智能算法中机器学习模型的上限,而机器学习模型只是逼近这个上限而已,因此构建一套行之有效的机器学习模型的特征集,对于提升机器学习模型的准确度具有重要的意义。
当前的特征构建方法,常见的方法有:基于数据字段类型定义一些数据汇总指标,比如最大小值、均值、方差等,而针对字符串数据类型,则利用文本的embedding(嵌入)方法将字符串数据转换为数值型特征,或者直接将字符串数据输入能够处理类别变量的算法模型中,比如决策树模型等。由此可见,当前的特征构建方法,没有针对数据的时序性进行分析,构建出的特征不具备时序性,不适用于物品销量预测领域的机器学习建模。
发明内容
基于此,有必要针对上述技术问题,提供一种用于物品销量预测的特征构建方法、装置、计算机设备和存储介质,能够使得构建出的特征具备时序性,从而使得构建出的特征能够很好地应用在物品销量预测领域。
一种用于物品销量预测的特征构建方法,包括:获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据;获取与当前时间段相关的历史时间段的影响因子的第二特征数据,以及基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据;根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。
在其中一个实施例中,一种用于物品销量预测的特征构建方法还包括:获取物品所属类别的与物品销量预测相关的第三特征数据;根据第三特征数据获取物品的销量趋势信息;根据销量趋势信息和多个第一特征数据中的销量特征数据构建物品销量预测的第四特征数据;根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集,包括:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集。
在其中一个实施例中,根据第三特征数据获取物品的销量趋势信息,包括:当第三特征数据包含类别的所述当前时间段的与物品销量预测相关的第一子特征数据时,根据第一子特征数据获取销量趋势信息;或,当第三特征数据包含类别的历史时间段的与物品销量预测相关的第二子特征数据时,根据第二子特征数据获取销量趋势信息。
在其中一个实施例中,类别包括物品所属的区域类别,和/或,物品所属的物品类别。
在其中一个实施例中,一种用于物品销量预测的特征构建方法还包括:从第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中获取两个或者两个以上的特征数据进行特征交叉计算,得到物品销量预测的第五特征数据;根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集,包括:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集。
在其中一个实施例中,特征交叉计算包括以下步骤:若两个或者两个以上的特征数据为连续性特征数据,将两个或两个以上的特征数据进行乘法运算;若两个或两个以上的特征为离散性特征数据,将两个或两个以上的特征数据进行字符串拼接运算。
在其中一个实施例中,第五特征数据为多个,一种用于物品销量预测的特征构建方法还包括:获取各第五特征数据的重要度;根据各第五特征数据的重要度从多个第五特征数据中筛选出目标第五特征数据;根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集,包括:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和目标第五特征数据构建物品销量预测的时序特征集。
一种用于物品销量预测的特征构建装置,包括:第一获取模块,用于获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据;第二获取模块,用于获取与当前时间段相关的历史时间段的影响因子的第二特征数据,以及基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据;构建模块,用于根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例方法的步骤。
上述用于物品销量预测的特征构建方法、装置、计算机设备和存储介质,获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据,获取与当前时间段相关的历史时间段的影响因子的第二特征数据,以及基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据,根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。
第一特征数据和第二特征数据分别代表当前时间段和历史时间段的特征数据,在进行物品销量预测时,将第一特征数据和第二特征数据输入时序预测模型,时序预测模型能够识别出两者的时序特性,并能够结合两者的时序特性对第一特征数据和第二特征数据进行数据处理,以预测物品销量。此外,第一差分特征数据通过各第一特征数据的时序特性对多个第一特征数据进行差分处理得到,由此第一差分特征数据具备当前时间段的时序差特性。同理,第二差分特征数据通过各第二特征数据的时序特性对多个第二特征数据进行差分处理得到,由此第二差分特征数据具备历史时间段的时序差特性。因此,将第一差分特征数据和第二差分特征数据输入时序预测模型,时序预测模型能够学习到第一差分特征数据和第二差分特征数据的时序差特性,并能够结合时序差特性进行物品销量预测。综上可知,根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集,时序特征集中的特征数据携带时序特性,能够很好地应用于物品销量预测领域。
附图说明
图1为一个实施例中一种用于物品销量预测的特征构建方法的应用环境图;
图2为一个实施例中一种用于物品销量预测的特征构建方法的流程示意图;
图3为一个实施例中商品销量数据的关联数据的拓扑图;
图4为一个实施例中一种用于物品销量预测的特征构建装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的一种用于物品销量预测的特征构建方法,可以应用于如图1所示的应用环境中。其中,数据库104中存储有当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及与当前时间段相关的历史时间段的影响因子的第二特征数据。服务器集群102从数据库104中获取第一特征数据和第二特征数据,并且基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据。以及,基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据。进而,根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。其中,服务器集群102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种用于物品销量预测的特征构建方法,以该方法应用于图1中的服务器集群102为例进行说明,包括以下步骤:
S202,获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据。
本实施例中,物品可以是商品。影响物品销量预测的影响因子包括物品库存、物品类别、物品销售价格、物品折扣、物品销量等。当前时间段包含多个当前时间点,各当前时间点对应有影响物品销量预测的影响因子的第一特征数据,也即是各第一特征数据携带有时序特性。基于各第一特征数据的时序特性可以对多个第一特征数据间进行差分处理。差分处理可以是:以时间的先后顺序将多个第一特征数据定义为时间序列,将相邻两个第一特征数据进行差分处理。例如,物品库存这一影响因子的多个第一特征数据包括前一时刻的库存量s1和后一时刻的库存量s2,对库存量s1和库存量s2进行差分处理,得到第一差分特征数据=s2-s1。物品销量这一影响因子的多个第一特征数据的处理方式如此类推。
举例说明:基于各第一特征数据的时序特性定义出时间序列以及差分序列。时间序列可以用近期滞后项表示,差分序列可以用近期差分项表示。如:
近期滞后项:xt,xt-1,xt-2……
近期差分项:Δt-k=xt-xt-k,k=1,2……
其中,t和k为正整数,xt-k表示第一特征数据,Δt-k表示第一差分特征数据。
需要说明的是,本实施例中所述影响物品销量预测的各个影响因子均可以对应有多个第一特征数据,第一特征数据的具体内容与各影响因子息息相关,例如物品库存这一影响因子,其对应的第一特征数据可以包括现有库存量、滞后库存量等,又例如物品销量这一影响因子,其对应的第一特征数据可以包括日销量、月销量、季度销量等,再例如物品类别这一影响因子,其对应的第一特征数据可以包括生活用品类、美妆类、玩具类、零食类、电器类等,本实施例对此均不作具体限定。
S204,获取与当前时间段相关的历史时间段的影响因子的第二特征数据,以及基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据。
本实施例中,历史时间段与当前时间段对应,即历史时间段为当前时间段对应过往时间的一个同期时间段。如,当前时间段为2021年11月的上旬,则历史时间段为2020年11月的上旬或2019年11月的上旬等。历史时间段包含多个历史时间点,各历史时间点对应有影响物品销量预测的影响因子的第二特征数据,也即是各第二特征数据携带有时序特性。基于各第二特征数据的时序特性可以对多个第二特征数据间进行差分处理。差分处理可以是:以时间的先后顺序将多个第二特征数据定义为时间序列,将相邻两个第二特征数据进行差分处理。
举例说明:基于各第二特征数据的时序特性定义出时间序列以及差分序列。时间序列可以用去年同期滞后项表示,差分序列可以用去年同期差分项表示。如:
去年同期滞后项:xy,t,xy,t-1,xy,t-2……
去年同期差分项:Δy,t-k=xy,t-k-xy,t-k-1,k=1,2……
其中,t和k为正整数,xy,t表示第二特征数据,Δy,t-k表示第二差分特征数据。
在一个实施例中,步骤S202和步骤S204之前,还包括:通过物品的标识信息对当前时间段的影响物品销量预测的影响因子的多个第一特征数据以及历史时间段的影响因子的第二特征数据进行关联。步骤S204,包括:根据物品的标识信息获取与当前时间段相关的历史时间段的影响因子的第二特征数据。
该实施例中,物品的标识信息可以是物品ID(Identity document,身份证标识号)。数据库中影响物品销量预测的各影响因子的特征数据分开存储,即第一特征数据和第二特征数据分开存储,或多个第一特征数据之间分开存储,多个第二特征数据之间分开存储,通过物品的标识信息可以将分开存储的特征数据进行关联,便于后续数据的读取。例如,基于物品的标识信息进行各部分特征数据的关联整合操作如下:
以物品为商品为例,针对常见的零售行业,其数据仓库一般存在如图3所示的数据表,数据整合操作为:以销售表为主表,关联商品维表、门店维表以及日期维表,再关联库存数据从而整合成一张宽表。其中,PK表示主键的意思,主键为数据库中记录唯一性的判断字段,比如商品维表的主键就是商品ID,每条商品ID代表一个商品,不能出现重复。此处商品ID可作为上述物品的标识信息的一个具体实现,因此通过商品ID可以将商品所有关联的数据,如上述第一特征数据和第二特征数据进行关联,从而便于商品关联数据的读取。
S206,根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。
本实施例中,构建物品销量预测的时序特征集可以是:将第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据作为时序特征集中的元素,构建时序特征集。或者,确定特征数据的筛选条件,根据筛选条件从第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据中筛选出一个或多个特征数据,将筛选出的特征数据作为时序特征集中的元素,构建时序特征集。
上述用于物品销量预测的特征构建方法,第一特征数据和第二特征数据分别代表当前时间段和历史时间段的特征数据,在进行物品销量预测时,将第一特征数据和第二特征数据输入时序预测模型,时序预测模型能够识别出两者的时序特性,并能够结合两者的时序特性对第一特征数据和第二特征数据进行数据处理,以预测物品销量。此外,第一差分特征数据通过各第一特征数据的时序特性对多个第一特征数据进行差分处理得到,由此第一差分特征数据具备当前时间段的时序差特性。同理,第二差分特征数据通过各第二特征数据的时序特性对多个第二特征数据进行差分处理得到,由此第二差分特征数据具备历史时间段的时序差特性。因此,将第一差分特征数据和第二差分特征数据输入时序预测模型,时序预测模型能够学习到第一差分特征数据和第二差分特征数据的时序差特性,并能够结合时序差特性进行物品销量预测。综上可知,根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集,时序特征集中的特征数据携带时序特性,能够很好地应用于物品销量预测领域。
在一个实施例中,上述根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集的步骤之前,还包括:获取物品所属类别的与物品销量预测相关的第三特征数据;根据第三特征数据获取物品的销量趋势信息;根据销量趋势信息和多个第一特征数据中的销量特征数据构建物品销量预测的第四特征数据。上述根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集的步骤,包括:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集。
该实施例中,第四特征数据表征物品的未来日期特征。通过构建未来日期特征的方式增加时序特征集中的特征数据。未来日期特征指的是未来某个时间点的与物品销量预测相关的特征。未来日期特征根据销量趋势信息和当前时间段的多个第一特征数据中的销量特征数据构建得到。通过构建未来日期特征,可以丰富物品销量预测的时序特征集。另外,上述实施例中获得的时序特征集中包含了历史时间段的特征数据以及当前时间段的特征数据,本实施例再向时序特征集中添加未来日期的特征数据,在使用时序特征集中的特征数据进行物品销量预测时,时序预测模型可以通过历史时间段的特征数据、当前时间段的特征数据和未来日期的特征数据构建更具备时序特征的时序序列。
其中,销量趋势信息根据物品所属类别的与物品销量预测相关的第三特征数据确定。第三特征数据的具体内容与物品所属类别息息相关。第三特征数据可以是物品所属类别的销量数据,也可以是物品所属类别的库存数据,等等,本实施例对此不作具体限定。例如,物品所属类别为区域类别,第三特征数据可以包括物品所属区域的销量特征数据。如,物品为广东区域的电器产品,则第三特征数据为广东区域的该电器产品的销量数据。例如,物品所属类别为品类类别,第三特征数据可以包括物品所属品类的销量特征数据。如,物品为玩具这一品类的商品,则第三特征数据可以包括玩具这一品类整体的销量特征数据。
在本实施例的一个示例中,第三特征数据包括物品所属类别的当前时间段的销量特征数据,通过当前时间段内前后时间的销量特征数据的比值可以确定出物品的销量趋势信息。还可以是,第三特征数据包括物品所属类别的历史时间段的销量特征数据,通过历史时间段内前后时间的销量特征数据的比值可以确定出物品的销量趋势信息。也即是,可以采用物品所属类别的当前时间段或历史时间段的销量特征数据计算物品的销量趋势信息。销量趋势信息能够表征出物品的销量趋势,此处采用销量趋势信息和当前时间段的第一特征数据中的销量特征数据能够构建出物品未来销量的第四特征数据。例如,销量趋势信息通过当前时间段内前后时间的销量特征数据的比值s表示,当前时间段的第一特征数据中的销量特征数据为销量额m,则构建第四特征数据为s*m。此处第四特征数据能够表征出预测的未来日期的物品销量。
由于物品的销量波动比较大,随机干扰性较强,若采用物品本身的特征数据确定物品的销量趋势,则得到的销量趋势稳定性较弱,进而准确性较低。然而,虽然物品的销量波动较大,但其对应所属类别的销量波动较小,稳定性较强,更能反映市场需求,因此本实施例采用物品所属的类别的与物品销量预测相关的第三特征数据确定物品的销量趋势信息,使得获取的销量趋势信息更加平稳,销量趋势信息更加准确,进而基于销量趋势信息和当前时间段的多个第一特征数据中的销量特征数据构建得到的第四特征数据,能够更加准确地描述未来日期的物品的预测销量。
由此,通过构建未来日期特征的方式增加时序特征集中的特征数据,丰富了用于物品销量预测的时序特征集的时序特征。此外,第四特征数据携带未来销量预测信息,从而使得采用时序特征集进行物品销量预测时,能够提高物品销量预测的准确度。此外,构建的时序特征集中包含未来日期的特征数据、当前时间段的特征数据、历史时间段的特征数据,因此时序特征集中的特征数据具备明显的时序特性,采用该时序特征集的特征数据作为时序预测模型的输入以进行物品销量预测时,模型能够学习到各特征数据之间的时序信息,并能构建历史、当前、未来时间段的各时序信息之间的关联关系,进而模型输出的物品销量预测结果更加准确、可靠。例如,采用transformer模型预测物品销量时,模型输入的特征数据中包含携带未来销量预测信息的特征数据、携带当前时间段信息的特征数据和携带历史时间段信息的特征数据,模型输出的物品销量预测结果更加准确。
在一个实施例中,上述根据第三特征数据获取物品的销量趋势信息,包括:当第三特征数据包含类别的当前时间段的与物品销量预测相关的第一子特征数据时,根据第一子特征数据获取销量趋势信息;或,当第三特征数据包含类别的历史时间段的与物品销量预测相关的第二子特征数据时,根据第二子特征数据获取销量趋势信息。
该实施例中,销量趋势信息可以通过物品所属类别的当前时间段的第一子特征数据确定,也可以通过物品所属类别的历史时间段的第二子特征数据确定。也即是,第一子特征数据为第三特征数据中表示当前时间段的特征数据,第二子特征数据为第三特征数据中表示历史时间段的特征数据。
销量趋势信息可以采用当前时间段的特征数据构建,也可以采用历史时间段的特征数据构建。具体采用哪种方式确定销量趋势信息,基于实际物品销量预测应用中的需求确定。具体地,第三特征数据包括物品所属类别的当前时间段的销量特征数据,通过当前时间段内前后时间的销量特征数据的比值可以确定出物品的销量趋势信息。还可以是,第三特征数据包括物品所属类别的历史时间段的销量特征数据,通过历史时间段内前后时间的销量特征数据的比值可以确定出物品的销量趋势信息。也即是,可以采用物品所属类别的当前时间段或历史时间段的销量特征数据计算物品的销量趋势信息。销量趋势信息能够表征出物品的销量趋势,此处采用销量趋势信息和当前时间段的第一特征数据中的销量特征数据能够构建出物品未来销量的第四特征数据。例如,销量趋势信息通过当前时间段内前后时间(或历史时间段内前后时间)的销量特征数据的比值s表示,当前时间段的第一特征数据中的销量特征数据为销量额m,则构建第四特征数据为s*m。此处第四特征数据能够表征出预测的未来日期的物品销量。因此,通过提供当前时间段的特征数据和历史时间段的特征数据这两种确定销量趋势信息的方式,能够满足实际应用中更多的需求。
在一个实施例中,上述物品所属的类别包括物品所属的区域类别,和/或,物品所属的物品类别。
该实施例中,物品所属的类别可以划分为区域类别和物品类别。区域类别指的是,按照区域划分时物品归属的区域指向的类别。物品类别指的是,按照物品属性划分时物品归属的类别。在进行物品销售时,不同的区域,其物品销量情况相差较大。但同一区域,其物品销量情况相差较小。而且,相对于单一物品来说,物品在同一区域内销量趋势较为稳定。同样地,不同的物品类别,其物品销量情况相差较大。但同一物品类别,其物品销量情况相差较小。而且,相对于单一物品来说,物品在同一物品类别内销量趋势较为稳定。因此,采用物品所属的区域类别和物品所属的物品类别中任一项或多项作为参考,确定销量趋势信息,能够更加准确地预测物品未来的销量。
在本实施例的一个示例中,对物品为商品进行销量预测,销量预测作为时序预测任务中的一种应用,为了更精确地确定商品的销量趋势信息,在该应用场景中,可以以物品所属的物品类别作为参考,即按照商品类别划分层级,以不同层级的商品销量数据来确定销量趋势信息。具体的,商品可分大类、小类、商品细类三个层级,可以理解的是,在时间预测中大类层级的商品销量最平稳,其波动趋势最能描述市场需求,且大类层级的销量数据扰动较小,更具有数据分析的意义,而商品细类层级的销量数据波动最大,随机干扰最多。如此,可以利用商品高层级(例如大类层级)的销量数据获取较为平稳的销量趋势信息、再与商品低层级(例如商品细类层级)的具体销量数据进行组合,将高层级销量数据中的特征信息与低层级销量数据中的特征信息进行融合并提取时序关联信息,从而可以得到一些更有效的时序特征。
例如,采用大类层级的商品销量数据计算出销量趋势信息,进而结合销量趋势信息和商品细类层级的商品销量数据计算得到未来销量数据,从而实现将高层级销量数据中的特征信息与低层级销量数据中的特征信息进行融合并提取时序关联信息,以得到一些更有效的时序特征。
在本实施例的一个具体示例中,假设物品为商品,要预测每个门店的每个商品的销量,可以从区域类别和商品类别两个维度得到一些更有效的特征组合:
区域类别层面:先计算每个仓库或者城市的商品的整体销量,得到仓库或城市去年同期的商品销量的增长率,以及今年的相对上一个周期的商品销量的增长率,之后将这些增长率乘以每个商品的销量,可以得到基于更高区域层级预测的商品未来销量。当将这个表征商品未来销量的特征数据作为模型输入时,模型输出更有效的特征。比如假设整个城市某个商品去年同期t时间以及t-1时间的销量分别为
Figure BDA0003358950810000131
而今年同期t-1时间的门店商品的销量为
Figure BDA0003358950810000132
那么可以得到新的组合特征为
Figure BDA0003358950810000133
也即是,得到的第四特征数据为
Figure BDA0003358950810000134
此处只是举例说明,实际应用时,也可以采用今年的相对上一个周期的商品销量的增长率确定第四特征数据。
商品类别层面:先计算商品大类、商品小类、商品自身(商品细类或SKU)的整体销量,类似上述区域类别层面中的操作,将高层级的波动趋势乘以商品自身层级的销量,可以得到基于更高层级预测的商品未来销量。当将这个表征商品未来销量的特征数据作为模型输入时,模型输出更有效的特征。假设门店商品对应商品大类的去年同期t时间以及t-1时间的销量分别为
Figure BDA0003358950810000135
而今年同期t-1时间门店商品的销量为
Figure BDA0003358950810000136
那么可以得到新的组合特征为
Figure BDA0003358950810000137
也即是,得到的第四特征数据为
Figure BDA0003358950810000138
此处只是举例说明,实际应用时,也可以采用今年的相对上一个周期的商品销量的增长率确定第四特征数据。
在一个实施例中,上述根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集的步骤之前,还包括:从第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中获取两个或者两个以上的特征数据进行特征交叉计算,得到物品销量预测的的第五特征数据。上述根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集的步骤,包括:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集。
该实施例中,第五特征数据为通过特征交叉的方式计算得到的具备两个或两个以上特征数据之间的关联关系的特征数据。通过特征交叉的方式增加时序特征集中的特征数据。具体地,在第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中获取两个或者两个以上的特征数据进行特征交叉计算,得到第五特征数据。其中,第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中获取两个或者两个以上的特征数据进行特征交叉计算,指的是每次从第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中获取两个或两个以上的特征数据进行特征交叉计算,不断重复此操作,直至遍历第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中所有的可能。例如,第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构成的特征数据集包括特征数据a、特征数据b、特征数据c、特征数据d以及特征数据e。随机抽取两个特征数据进行特征交叉计算,直至遍历所有的可能,此种情况下进行特征交叉计算的特征组合包括:特征数据a和特征数据b、特征数据a和特征数据c、特征数据a和特征数据d、特征数据a和特征数据e、特征数据b和特征数据c、特征数据b和特征数据d、特征数据b和特征数据e、特征数据c和特征数据d、特征数据c和特征数据e,以及特征数据d和特征数据e。随机抽取两个以上的任一数量的特征数据进行特征交叉计算的方式如此类推。
对于物品销量预测场景,一般可用的训练数据集非常大,如上述各个实施例得到的时序特征集,但是时序特征集中每个特征数据相对独立。例如,销量特征数据、库存特征数据、区域特征数据、物品类别特征数据等。该实施例中,通过特征交叉的方式,能够挖掘特征数据间的更多有效信息,建立各个特征数据之间的关联关系,并以上述特征数据任意组合的方式可以将特征数据间的关联关系进行深化和提炼,能够构造新的特征数据(即第五特征数据),从而得到的第五特征数据能够体现两个或两个以上的特征数据之间的关联关系。例如,通过销量特征数据和区域特征数据的特征交叉计算,可得到表征销量和区域之间的有效信息的特征数据。因此,通过特征交叉的方式,不仅能够扩大时序特征集的特征数据的数据量,并且能够增加更多更有效的特征数据,从而使得采用时序特征集的特征数据进行物品销量预测时,得到的销量预测结果更为准确。
当前的机器学习模型的特征构建方式中,基本上构建的特征数据属于比较孤立的特征数据,即表示单一特征的特征数据。如,销量特征数据、库存特征数据和价格特征数据。销量特征数据只表示出销量这一特征,库存特征数据只表示出库存这一特征,价格特征数据只表示价格这一特征。上述实施例通过特征交叉的方式构建出新的特征数据,新的特征数据能够表征出多个特征数据之间的关联关系,因此能够在现有单一特征数据的基础上,扩展出表征更多特征特性的特征数据,从而丰富时序特征集。进一步地,当利用第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集时,该时序特征集更为丰富,特征信息更加多元化,在使用该时序特征集进行算法模型训练时,算法模型能够学习到时序特征集中更多的特征信息,从而使用训练后的算法模型进行物品销量预测时,得到的物品预测结果更加准确。
在一个实施例中,上述特征交叉计算包括以下步骤:若两个或者两个以上的特征数据为连续性特征数据,将两个或两个以上的特征数据进行乘法运算;若两个或两个以上的特征为离散性特征数据,将两个或两个以上的特征数据进行字符串拼接运算。
该实施例中,将当前已有的特征数据,如上述第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据,按照是否连续划分为两部分,即连续性特征数据和离散性特征数据。
从由多个连续性特征数据构成的连续特征集中,按照排列组合的方式,随机选择2个连续性特征数据,将2个连续性特征数据进行乘法运算,从而得到新的连续性特征数据,重复此操作,直至遍历所有可能。例如已有的连续性特征数据包括商品价格p、滞后销量xt-1以及滞后库存it-1,那么可以延伸生成3个组合特征:p*xt-1、p*it-1、xt-1*p,即构建得到3个新的连续性特征数据。
从由多个离散性特征数据构成的离散特征集中,按照排列组合的方式,随机选择2个离散性特征数据,将2个离散性特征数据进行字符串拼接操作,从而得到新的离散性特征数据,重复此操作,直至遍历所有可能。例如已有的离散性特征数据中包括商品大类类别c1、门店所属省份l1以及商品是否具有季节属性s,那么可以延伸3个组合特征:c1+l1、c1+s、l1+s,即构建得到3个新的离散性特征数据。
还可以在上述计算方式中,将每次选择的连续性/离散性特征数据的数量设置为3,4,…,这样可以将更多的特征数据进行交叉计算,从而可以得到更多的特征数据。
在一个实施例中,上述第五特征数据为多个,上述根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集的步骤之前,还包括:获取各第五特征数据的重要度;根据各第五特征数据的重要度从多个第五特征数据中筛选出目标第五特征数据。上述根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集的步骤,包括:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和目标第五特征数据构建物品销量预测的时序特征集。
该实施例中,构建时序特征集之前,对特征交叉计算得到的多个第五特征数据进行筛选,筛选的标准为各个第五特征数据的重要度。其中,特征交叉计算得到的多个第五特征数据时,为各第五特征数据设置重要度,重要度可以根据各第五特征数据用于物品销量预测时体现的特征价值确定。如,商品价格和商品折扣的交叉特征,由于商品价格和商品折扣的特征交叉所挖掘到的特征有效性不大,即商品价格和商品折扣之间的交叉信息对于物品销量预测没有太大的贡献,此时可对商品价格和商品折扣的交叉特征设置较小的重要度。如,商品价格p和滞后销量xt-1的交叉特征p*xt-1,由于商品价格p和滞后销量xt-1的特征交叉所挖掘到的特征有效性较大,即商品价格p和滞后销量xt-1之间的交叉信息对于物品销量预测具有较大的贡献,此时可对交叉特征p*xt-1设置较大的重要度。如此类推,设置各个第五特征数据的重要度。基于各个第五特征数据的重要度进行筛选,得到目标第五特征数据,之后根据目标第五特征数据、第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集。
由于特征交叉计算时,随机选取两个或两个以上的特征数据进行特征交叉计算,没有关注到两个或两个以上的特征数据之间的交叉信息的有效性,因此特征交叉计算后得到的第五特征数据中会存在部分特征数据对物品销量预测影响不大,如特征交叉后得到的第五特征数据为无效数据,此时根据各第五特征数据的重要度进行特征筛选后,采用得到的目标第五特征数据构建物品销量预测的时序特征集,可以减少后续时序特征集中无效数据的应用造成的数据计算冗余,还可以防止采用时序特征集的时序预测模型出现过拟合现象。如,在实际建模应用中,再基于第五特征数据的重要性采用丢弃dropout方法,剔除无意义的第五特征数据,防止模型出现过拟合现象,从而保障整体预测结果的稳定性和准确性。
在一个实施例中,上述构建物品销量预测的时序特征集之后,还包括:采用计算机编程语言python或计算引擎spark对时序特征集中的特征数据进行处理,得到当前时间段的时间点数据。
该实施例中,采用上述任一实施例得到时序特征集之后,若时序特征集中的特征数据较小,可以利用python等计算机编程语言实现自动化生成每个时间点数据,当数据较大时,可以使用计算引擎spark等工具实现并行化大规模处理,由此可以得到一份较为完善且基本适用于任何时序预测模型的特征数据。当有多个预测场景时,只需要基于预测场景修改部分参数,如修改物品的影响因子等参数,即可重新生成一份可靠数据,从而极大提升工作效率。
本申请的一种用于物品销量预测的特征构建方法,能够将大数据中时序关系紧密的特征数据进行抽取,如当前时间段和历史时间段的特征数据,以及第一差分特征数据和第二差分特征数据,从而更好地捕捉特征数据的时序趋势信息,而传统的特征构建方法未能处理这部分信息,因此采用本申请的一种用于物品销量预测的特征构建方法构建得到的时序特征集,更加适用于常见的时间序列建模。
此外,本申请的一种用于物品销量预测的特征构建方法,采用了构建未来日期特征的方式增加时序特征集中的特征数据,以及采用特征交叉的方式增加时序特征集中的特征数据,操作简单,在实际建模中亦取得非常好的效果,可以针对自身数据状况控制数据增强的规模,可操作性非常强。
应该理解的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种用于物品销量预测的特征构建装置,包括第一获取模块402、第二获取模块404以及构建模块406。第一获取模块402,用于获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据;第二获取模块404,用于获取与当前时间段相关的历史时间段的影响因子的第二特征数据,以及基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据;构建模块406,用于根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。
在一个实施例中,上述一种用于物品销量预测的特征构建装置还包括第三获取模块,用于获取物品所属类别的与物品销量预测相关的第三特征数据;根据第三特征数据获取物品的销量趋势信息;根据销量趋势信息和多个第一特征数据中的销量特征数据构建物品销量预测的第四特征数据。构建模块406具体用于根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集。
在一个实施例中,根据第三特征数据获取物品的销量趋势信息,包括:当第三特征数据包含类别的当前时间段的与物品销量预测相关的第一子特征数据时,根据第一子特征数据获取销量趋势信息;或,当第三特征数据包含类别的历史时间段的与物品销量预测相关的第二子特征数据时,根据第二子特征数据获取销量趋势信息。
在一个实施例中,类别包括物品所属的区域类别,和/或,物品所属的物品类别。
在一个实施例中,上述一种用于物品销量预测的特征构建装置还包括计算模块,用于从第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中获取两个或者两个以上的特征数据进行特征交叉计算,得到物品销量预测的第五特征数据。构建模块406具体用于根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集。
在一个实施例中,特征交叉计算包括以下步骤:若两个或者两个以上的特征数据为连续性特征数据,将两个或两个以上的特征数据进行乘法运算;若两个或两个以上的特征为离散性特征数据,将两个或两个以上的特征数据进行字符串拼接运算。
在一个实施例中,第五特征数据为多个,上述一种用于物品销量预测的特征构建装置还包括筛选模块,用于获取各第五特征数据的重要度;根据各第五特征数据的重要度从多个第五特征数据中筛选出目标第五特征数据;构建模块406具体用于根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和目标第五特征数据构建物品销量预测的时序特征集。
关于用于物品销量预测的特征构建装置的具体限定可以参见上文中对于用于物品销量预测的特征构建方法的限定,在此不再赘述。上述用于物品销量预测的特征构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用于物品销量预测的特征构建方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据;获取与当前时间段相关的历史时间段的影响因子的第二特征数据,以及基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据;根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。
在一个实施例中,处理器执行计算机程序实现时还实现以下步骤:获取物品所属类别的与物品销量预测相关的第三特征数据;根据第三特征数据获取物品的销量趋势信息;根据销量趋势信息和多个第一特征数据中的销量特征数据构建物品销量预测的第四特征数据;处理器执行计算机程序实现上述的根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集的步骤时,具体实现以下步骤:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集。
在一个实施例中,处理器执行计算机程序实现上述的根据第三特征数据获取物品的销量趋势信息的步骤时,具体实现以下步骤:当第三特征数据包含类别的当前时间段的与物品销量预测相关的第一子特征数据时,根据第一子特征数据获取销量趋势信息;或,当第三特征数据包含类别的历史时间段的与物品销量预测相关的第二子特征数据时,根据第二子特征数据获取销量趋势信息。
在一个实施例中,类别包括物品所属的区域类别,和/或,物品所属的物品类别。
在一个实施例中,处理器执行计算机程序实现时还实现以下步骤:从第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中获取两个或者两个以上的特征数据进行特征交叉计算,得到物品销量预测的第五特征数据;处理器执行计算机程序实现上述的根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集的步骤时,具体实现以下步骤:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集。
在一个实施例中,处理器执行计算机程序实现上述的特征交叉计算的步骤时,具体实现以下步骤:若两个或者两个以上的特征数据为连续性特征数据,将两个或两个以上的特征数据进行乘法运算;若两个或两个以上的特征为离散性特征数据,将两个或两个以上的特征数据进行字符串拼接运算。
在一个实施例中,第五特征数据为多个,处理器执行计算机程序实现时还实现以下步骤:获取各第五特征数据的重要度;根据各第五特征数据的重要度从多个第五特征数据中筛选出目标第五特征数据;处理器执行计算机程序实现上述的根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集的步骤时,具体实现以下步骤:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和目标第五特征数据构建物品销量预测的时序特征集。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各第一特征数据的时序特性对多个第一特征数据进行差分处理,得到第一差分特征数据;获取与当前时间段相关的历史时间段的影响因子的第二特征数据,以及基于各第二特征数据的时序特性对多个第二特征数据进行差分处理,得到第二差分特征数据;根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集。
在一个实施例中,计算机程序被处理器执行实现时还实现以下步骤:获取物品所属类别的与物品销量预测相关的第三特征数据;根据第三特征数据获取物品的销量趋势信息;根据销量趋势信息和多个第一特征数据中的销量特征数据构建物品销量预测的第四特征数据;计算机程序被处理器执行实现上述的根据第一特征数据、第一差分特征数据、第二特征数据和第二差分特征数据构建物品销量预测的时序特征集的步骤时,具体实现以下步骤:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集。
在一个实施例中,计算机程序被处理器执行实现上述的根据第三特征数据获取物品的销量趋势信息的步骤时,具体实现以下步骤:当第三特征数据包含类别的当前时间段的与物品销量预测相关的第一子特征数据时,根据第一子特征数据获取销量趋势信息;或,当第三特征数据包含类别的历史时间段的与物品销量预测相关的第二子特征数据时,根据第二子特征数据获取销量趋势信息。
在一个实施例中,类别包括物品所属的区域类别,和/或,物品所属的物品类别。
在一个实施例中,计算机程序被处理器执行实现时还实现以下步骤:从第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据中获取两个或者两个以上的特征数据进行特征交叉计算,得到物品销量预测的第五特征数据;计算机程序被处理器执行实现上述的根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据和第四特征数据构建物品销量预测的时序特征集的步骤时,具体实现以下步骤:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集。
在一个实施例中,计算机程序被处理器执行实现上述的特征交叉计算的步骤时,具体实现以下步骤:若两个或者两个以上的特征数据为连续性特征数据,将两个或两个以上的特征数据进行乘法运算;若两个或两个以上的特征为离散性特征数据,将两个或两个以上的特征数据进行字符串拼接运算。
在一个实施例中,第五特征数据为多个,计算机程序被处理器执行实现时还实现以下步骤:获取各第五特征数据的重要度;根据各第五特征数据的重要度从多个第五特征数据中筛选出目标第五特征数据;计算机程序被处理器执行实现上述的根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和第五特征数据构建物品销量预测的时序特征集的步骤时,具体实现以下步骤:根据第一特征数据、第一差分特征数据、第二特征数据、第二差分特征数据、第四特征数据和目标第五特征数据构建物品销量预测的时序特征集。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种用于物品销量预测的特征构建方法,所述方法包括:
获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各所述第一特征数据的时序特性对所述多个第一特征数据进行差分处理,得到第一差分特征数据;
获取与所述当前时间段相关的历史时间段的所述影响因子的第二特征数据,以及基于各所述第二特征数据的时序特性对所述多个第二特征数据进行差分处理,得到第二差分特征数据;
根据所述第一特征数据、所述第一差分特征数据、所述第二特征数据和所述第二差分特征数据构建所述物品销量预测的时序特征集。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述物品所属类别的与所述物品销量预测相关的第三特征数据;
根据所述第三特征数据获取所述物品的销量趋势信息;
根据所述销量趋势信息和多个第一特征数据中的销量特征数据构建所述物品销量预测的第四特征数据;
所述根据所述第一特征数据、所述第一差分特征数据、所述第二特征数据和所述第二差分特征数据构建所述物品销量预测的时序特征集,包括:
根据所述第一特征数据、所述第一差分特征数据、所述第二特征数据、所述第二差分特征数据和所述第四特征数据构建所述物品销量预测的时序特征集。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第三特征数据获取所述物品的销量趋势信息,包括:
当所述第三特征数据包含所述类别的所述当前时间段的与所述物品销量预测相关的第一子特征数据时,根据所述第一子特征数据获取所述销量趋势信息;
或,
当所述第三特征数据包含所述类别的所述历史时间段的与所述物品销量预测相关的第二子特征数据时,根据所述第二子特征数据获取所述销量趋势信息。
4.根据权利要求2或3所述的方法,其特征在于,所述类别包括所述物品所属的区域类别,和/或,所述物品所属的物品类别。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
从所述第一特征数据、所述第一差分特征数据、所述第二特征数据、所述第二差分特征数据和所述第四特征数据中获取两个或者两个以上的特征数据进行特征交叉计算,得到所述物品销量预测的第五特征数据;
所述根据所述第一特征数据、所述第一差分特征数据、所述第二特征数据、所述第二差分特征数据和所述第四特征数据构建所述物品销量预测的时序特征集,包括:
根据所述第一特征数据、所述第一差分特征数据、所述第二特征数据、所述第二差分特征数据、所述第四特征数据和所述第五特征数据构建所述物品销量预测的时序特征集。
6.根据权利要求5所述的方法,其特征在于,所述特征交叉计算包括以下步骤:
若所述两个或者两个以上的特征数据为连续性特征数据,将所述两个或两个以上的特征数据进行乘法运算;
若所述两个或两个以上的特征为离散性特征数据,将所述两个或两个以上的特征数据进行字符串拼接运算。
7.根据权利要求5或6所述的方法,其特征在于,所述第五特征数据为多个,所述方法还包括:
获取各所述第五特征数据的重要度;
根据各所述第五特征数据的重要度从多个第五特征数据中筛选出目标第五特征数据;
所述根据所述第一特征数据、所述第一差分特征数据、所述第二特征数据、所述第二差分特征数据、所述第四特征数据和所述第五特征数据构建所述物品销量预测的时序特征集,包括:
根据所述第一特征数据、所述第一差分特征数据、所述第二特征数据、所述第二差分特征数据、所述第四特征数据和所述目标第五特征数据构建所述物品销量预测的时序特征集。
8.一种用于物品销量预测的特征构建装置,其特征在于,所述装置包括:
第一获取模块,用于获取当前时间段的影响物品销量预测的影响因子的多个第一特征数据,以及基于各所述第一特征数据的时序特性对所述多个第一特征数据进行差分处理,得到第一差分特征数据;
第二获取模块,用于获取与所述当前时间段相关的历史时间段的所述影响因子的第二特征数据,以及基于各所述第二特征数据的时序特性对所述多个第二特征数据进行差分处理,得到第二差分特征数据;
构建模块,用于根据所述第一特征数据、所述第一差分特征数据、所述第二特征数据和所述第二差分特征数据构建所述物品销量预测的时序特征集。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
CN202111360223.5A 2021-11-17 2021-11-17 用于物品销量预测的特征构建方法、装置和存储介质 Pending CN114169914A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111360223.5A CN114169914A (zh) 2021-11-17 2021-11-17 用于物品销量预测的特征构建方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111360223.5A CN114169914A (zh) 2021-11-17 2021-11-17 用于物品销量预测的特征构建方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN114169914A true CN114169914A (zh) 2022-03-11

Family

ID=80479841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111360223.5A Pending CN114169914A (zh) 2021-11-17 2021-11-17 用于物品销量预测的特征构建方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN114169914A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117934048A (zh) * 2024-03-14 2024-04-26 深圳美云集网络科技有限责任公司 一种电商商品销量分析方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493151A (zh) * 2019-01-10 2019-03-19 哈步数据科技(上海)有限公司 销量预测方法及系统
CN111242672A (zh) * 2019-12-30 2020-06-05 中央财经大学 一种基于增量算法的需求预测方法
CN111783938A (zh) * 2020-05-25 2020-10-16 华为技术有限公司 时间序列的预测方法和装置
CN112308282A (zh) * 2019-11-27 2021-02-02 北京沃东天骏信息技术有限公司 数据处理方法、装置、电子设备和计算机存储介质
CN113159355A (zh) * 2020-01-07 2021-07-23 北京京邦达贸易有限公司 数据预测方法、装置、物流货量预测方法、介质、设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493151A (zh) * 2019-01-10 2019-03-19 哈步数据科技(上海)有限公司 销量预测方法及系统
CN112308282A (zh) * 2019-11-27 2021-02-02 北京沃东天骏信息技术有限公司 数据处理方法、装置、电子设备和计算机存储介质
CN111242672A (zh) * 2019-12-30 2020-06-05 中央财经大学 一种基于增量算法的需求预测方法
CN113159355A (zh) * 2020-01-07 2021-07-23 北京京邦达贸易有限公司 数据预测方法、装置、物流货量预测方法、介质、设备
CN111783938A (zh) * 2020-05-25 2020-10-16 华为技术有限公司 时间序列的预测方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵伊婷: "基于时间序列的商店商品连续时期的销量预测及分析", 《科技经济导刊》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117934048A (zh) * 2024-03-14 2024-04-26 深圳美云集网络科技有限责任公司 一种电商商品销量分析方法和系统

Similar Documents

Publication Publication Date Title
Hong et al. Probabilistic electric load forecasting: A tutorial review
Chatterjee et al. Stock price prediction using time series, econometric, machine learning, and deep learning models
Juszczyk The challenges of nonparametric cost estimation of construction works with the use of artificial intelligence tools
Zhang et al. A novel sequence to sequence data modelling based CNN-LSTM algorithm for three years ahead monthly peak load forecasting
CN110610382A (zh) 车辆销售量预测方法、装置、计算机设备和存储介质
Ferdoush et al. A short-term hybrid forecasting model for time series electrical-load data using random forest and bidirectional long short-term memory
Wang et al. Feature selection for probabilistic load forecasting via sparse penalized quantile regression
CN114066510A (zh) 物品销量预测方法、装置、计算机设备和存储介质
CN110909975B (zh) 科研平台效益评估方法、装置
Monken et al. Graph neural networks for modeling causality in international trade
Jiang et al. Application of machine learning model and hybrid model in retail sales forecast
CN114169914A (zh) 用于物品销量预测的特征构建方法、装置和存储介质
Mishra et al. Performance evaluation of prophet and STL-ETS methods for load forecasting
Velmurugan et al. Superior fuzzy enumeration crop prediction algorithm for big data agriculture applications
Patil et al. A study of opinion mining and data mining techniques to analyse the cryptocurrency market
Usman et al. Data analytics for short term price and load forecasting in smart grids using enhanced recurrent neural network
Jadli et al. A Novel LSTM-GRU-Based Hybrid Approach for Electrical Products Demand Forecasting.
Tran et al. Effects of Data Standardization on Hyperparameter Optimization with the Grid Search Algorithm Based on Deep Learning: A Case Study of Electric Load Forecasting
CN110766465A (zh) 金融产品评估方法及其验证方法、装置
CN110110885A (zh) 信息预测方法、装置、计算机设备和存储介质
CN109829745A (zh) 营收数据预测方法、装置、计算机设备和存储介质
CN109767031A (zh) 模型分类器建立方法、装置、计算机设备和存储介质
CN110084400A (zh) 信息预测方法、装置、计算机设备和存储介质
CN109767263A (zh) 营收数据预测方法、装置、计算机设备和存储介质
Cramer et al. Feature engineering for improving financial derivatives-based rainfall prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220311