CN112418898A - 基于多时间窗口融合的物品需求数据分析方法和装置 - Google Patents
基于多时间窗口融合的物品需求数据分析方法和装置 Download PDFInfo
- Publication number
- CN112418898A CN112418898A CN201910774356.3A CN201910774356A CN112418898A CN 112418898 A CN112418898 A CN 112418898A CN 201910774356 A CN201910774356 A CN 201910774356A CN 112418898 A CN112418898 A CN 112418898A
- Authority
- CN
- China
- Prior art keywords
- demand data
- time window
- demand
- data
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000004927 fusion Effects 0.000 title claims abstract description 37
- 238000007405 data analysis Methods 0.000 title claims description 25
- 238000004458 analytical method Methods 0.000 claims abstract description 40
- 230000002159 abnormal effect Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 12
- 230000035772 mutation Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013450 outlier detection Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
Abstract
本发明公开了一种基于多时间窗口融合的物品需求数据分析方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同;针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据;将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。该实施方式既能保证分析结果的准确性,又能保证分析结果的稳定性,使得分析结果在较长一段时间内平滑变动,而非突变。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于多时间窗口融合的物品需求数据分析方法和装置。
背景技术
在电商领域,物品的需求数据是物品的重要数据,对物品的需求数据进行分析处理便于了解物品的销售情况以及制定营销策略。例如,在自动化仓库中,根据物品的畅销程度安排库存分布,使得畅销物品的存储位置离工作站更近,较少搬运设备行走距离,提高仓库运营效率;再例如,在物品营销时,根据物品的点击量确定物品在营销网页的展位,使得点击量高的物品更容易被用户关注到。
现有的需求数据分析方法一般仅考虑短期数据分析的准确性。由于分析结果可能会受促销活动等影响,尤其是一些滞销物品、换季物品的促销,例如促销之后这些物品的销量很可能会突然降低、换季后季节性物品的关注度会发生变化等。因此,仅考虑短期数据分析的准确性,会造成解析结果的变动较大。
发明内容
有鉴于此,本发明实施例提供一种基于多时间窗口融合的物品需求数据分析方法和装置,既能保证分析结果的准确性,又能保证分析结果的稳定性,使得分析结果在较长一段时间内平滑变动,而非突变。
为实现上述目的,根据本发明实施例的一个方面,提供了一种基于多时间窗口融合的物品需求数据分析方法,包括:
获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同;
针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据;
将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。
可选地,根据该时间窗口对应的历史需求数据确定该时间窗口的第一需求数据之前,还包括:
对于所述历史需求数据中每个统计单位内的物品需求数据,若其大于需求阈值,则将该物品需求数据标记为异常值;
当所述异常值满足如下任一条件时,确定所述时间窗口中物品需求数据的均值,并将所述异常值替换为所述均值:
存在所述异常数据对应的统计单位前M个和后M个统计单位内的物品需求数据,且(2M+1)个统计单位中物品需求数据大于等于所述需求阈值的统计单位的数量小于(M+1)个;
不存在所述异常数据对应的统计单位前M个或后M个统计单位内的物品需求数据。
可选地,按照如下公式确定所述需求阈值:
S0=μ+3σ;
式中,S0代表需求阈值,μ代表所述时间窗口中物品需求数据的均值,σ代表所述时间窗口中物品需求数据的标准差。
可选地,采用移动加权平均方法确定各个时间窗口的第一需求数据;和/或,基于熵权法将所述多个时间窗口对应的第一需求数据融合。
根据本发明实施例的第二方面,提供一种基于多时间窗口融合的物品需求数据分析装置,包括:
获取模块,获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同;
确定模块,针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据;
融合模块,将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。
可选地,根据该时间窗口对应的历史需求数据确定该时间窗口的第一需求数据之前,所述确定模块还用于:
对于所述历史需求数据中每个统计单位内的物品需求数据,若其大于需求阈值,则将该物品需求数据标记为异常值;
当所述异常值满足如下任一条件时,确定所述时间窗口中物品需求数据的均值,并将所述异常值替换为所述均值:
存在所述异常数据对应的统计单位前M个和后M个统计单位内的物品需求数据,且(2M+1)个统计单位中物品需求数据大于等于所述需求阈值的统计单位的数量小于(M+1)个;
不存在所述异常数据对应的统计单位前M个或后M个统计单位内的物品需求数据。
可选地,所述确定模块按照如下公式确定所述需求阈值:
S0=μ+3σ;
式中,S0代表需求阈值,μ代表所述时间窗口中物品需求数据的均值,σ代表所述时间窗口中物品需求数据的标准差。
可选地,所述确定模块采用移动加权平均方法确定各个时间窗口的第一需求数据;和/或,所述融合模块基于熵权法将所述多个时间窗口对应的第一需求数据融合。
根据本发明实施例的第三方面,提供一种基于多时间窗口融合的物品需求数据分析电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例第一方面提供的基于多时间窗口融合的物品需求数据分析方法。
根据本发明实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例第一方面提供的基于多时间窗口融合的物品需求数据分析方法。
上述发明中的一个实施例具有如下优点或有益效果:通过对多个不同长度的多个时间窗口的历史需求数据进行分析和融合,既能保证分析结果的准确性,又能保证分析结果的稳定性,使得分析结果在较长一段时间内平滑变动,而非突变。通过对历史需求数据进行平滑处理,能够减小促销等活动对物品需求数据的影响,进一步提高预测准确性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的基于多时间窗口融合的物品需求数据分析方法的主要流程的示意图;
图2是根据本发明实施例的基于多时间窗口融合的物品需求数据分析装置的主要模块的示意图;
图3是本发明实施例可以应用于其中的示例性系统架构图;
图4是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
根据本发明实施例的一个方面,提供了一种基于多时间窗口融合的物品需求数据分析方法。图1是根据本发明实施例的基于多时间窗口融合的物品需求数据分析方法的主要流程的示意图,如图1所示,基于多时间窗口融合的物品需求数据分析方法,包括:步骤S101、步骤S102和步骤S103。
步骤S101、获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同。
需求数据是指能够反映物品的需求的数据。例如,物品的销量、点击量(物品在购物网页上的链接被点击的数量或者有多少个订单包含该物品)等。时间窗口是指从当前统计单位开始,往前推的一个时间段。时间窗口的长度是指从当前统计单位开始,往前推的统计单位的数量。以统计单位为天为例,时间窗口是指从当天日期开始往前推的天数。本发明实施例仅考虑时间窗口内的数据。实际应用过程中,统计单位也可以是小时、周、月等。
若仅采用一个时间窗口内的数据,当该时间窗口的长度较小时,则分析结果仅能反映短期的数据情况。由于需求数据可能会受促销活动等影响,尤其是一些滞销物品、换季物品的促销,例如促销之后这些物品的销量很可能会突然降低、换季后季节性物品的关注度会发生变化等。因此,仅考虑短期需求数据会造成解析结果的变动较大。若仅采用一个时间窗口内的数据,当该时间窗口的长度较大时,则分析结果仅能反映长期的数据情况,无法对短期的数据情况作出灵敏反映。本发明实施例采用多个时间窗口,且多个时间窗口的长度不同,既能对短期数据作出灵敏反映,又能反映较长时间内物品的需求数据情况。
步骤S102、针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据。
本步骤分别对每个时间窗口内的历史需求数据进行分析。以预测物品未来的需求数据为例,分别根据每个时间窗口内的历史需求数据预测未来的需求数据,得到各个时间窗口对应的预测值。
可选地,根据该时间窗口对应的历史需求数据确定该时间窗口的第一需求数据之前,还包括:对于所述历史需求数据中每个统计单位内的物品需求数据,若其大于需求阈值,则将该物品需求数据标记为异常值;当所述异常值满足如下任一条件时,确定所述时间窗口中物品需求数据的均值,并将所述异常值替换为所述均值:存在所述异常数据对应的统计单位前M个和后M个统计单位内的物品需求数据,且(2M+1)个统计单位中物品需求数据大于等于所述需求阈值的统计单位的数量小于(M+1)个;不存在所述异常数据对应的统计单位前M个或后M个统计单位内的物品需求数据。能够对历史需求数据进行平滑处理,通过对历史需求数据进行平滑处理,能够减小促销等活动对物品需求数据的影响,进一步提高预测准确性。
需求阈值可以根据实际情况进行选择性确定。可选地,按照如下公式确定所述需求阈值:
S0=μ+3σ;
式中,S0代表需求阈值,μ代表所述时间窗口中物品需求数据的均值,σ代表所述时间窗口中物品需求数据的标准差。采用这种方式确定需求阈值,准确性好,方法简单。
在一些实施例中,可以针对每个时间窗口的历史需求数据分别计算均值和标准差。假设基于两个时间窗口(时间窗口1和时间窗口2)的历史需求数据进行物品需求分析。对于时间窗口1,根据时间窗口1的历史需求数据1确定时间窗口1对应的μ1和标准差σ1,对于历史需求数据1中的每个异常值,将其替换为均值μ1,时间窗口1对应的需求阈值为(μ1+3σ1)。对于时间窗口2,根据时间窗口2的历史需求数据2确定时间窗口2对应的均值μ2和标准差σ2,对于历史需求数据2中的每个异常值,将其替换为均值μ2,时间窗口2对应的需求阈值为(μ2+3σ2)。
在另一些实施例中,可以针对所有时间窗口的历史需求数据一次性进行平滑处理。示例性地,基于两个时间窗口(时间窗口1和时间窗口2)的历史需求数据进行物品需求分析。则在进行平滑处理时,根据时间窗口1的历史需求数据1与时间窗口2的历史需求数据2确定所有历史需求数据的均值μ3和标准差σ3,对于所有历史需求数据中的每个异常值,将其替换为均值μ3,时间窗口1和时间窗口2对应的需求阈值均为(μ3+3σ3)。
进一步地,基于多个时间窗口的历史需求数据进行物品需求分析时,若多个时间窗口的历史需求数据存在重叠,则可以以去除重复部分后的历史需求数据进行上述均值的计算。示例性地,采用三个时间窗口进行物品需求分析,三个时间窗口分别为过去7天、过去15天和过去30天,则可以以过去30天的历史需求数据进行上述均值和标准差的计算。此时,在进行物品需求分析时,可以首先对过去30天的历史需求数据进行平滑处理,然后基于平滑处理后的数据执行确定各个时间窗口的第一需求数据的步骤。
需要说明的是,虽然前述示例中使用了均值和标准差过滤的方式对历史需求数据进行处理,并加入了一些简单的异常销量检测规则,本领域技术人员也可以采用其他异常检测或者离群点检测方式,比如聚类分析、基于密度的离群点检测等。
第一需求数据的算法可以根据实际情况进行选择性设定,例如,以时间窗口内历史需求数据的平均值或者期望值作为第一需求数据。可选地,采用移动加权平均方法确定各个时间窗口的第一需求数据。具体地址,按照如下公式确定第一需求数据:
式中,C代表第一需求数据,W代表时间窗口长度,即时间窗口内统计单元的数量;Csi代表第i个统计单位内物品s的需求数据。采用移动加权平均方法确定各个时间窗口的第一需求数据,准确性好,方法简单。
步骤S103、将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。本发明实施例采用多个时间窗口,且多个时间窗口的长度不同,既能对短期数据作出灵敏反映,又能反映较长时间内物品的需求数据情况。通过对多个不同长度的多个时间窗口的历史需求数据进行分析和融合,既能保证分析结果的准确性,又能保证分析结果的稳定性,使得分析结果在较长一段时间内平滑变动,而非突变。
在对个时间窗口的第一需求数据进行融合时,可以先确定各个时间窗口的权重,基于确定出的权重将各个时间窗口的第一需求数据加权求和,得到最终的分析结果。权重值得确定可以根据实际情况进行选择性设定,例如侧重于中长期分析时,则将中长期的时间窗口的权重调高,侧重短期分析时,则将短期时间窗口的权重调高。可选地,基于熵权法将多个时间窗口对应的第一需求数据融合。熵是系统无序程度的一个度量;如果指标的信息熵越小,该时间窗口提供的信息量越小,在综合评价中所起作用理当越小,权重就应该越低。因此,可利用信息熵这个工具,计算出各个时间窗口的权重,为多指标综合评价提供依据。采用这种方式进行融合,在保证基于短期时间窗口的分析结果有较小损失的基础上,能够有效保证物品中长期的分析结果的的稳定性和准确性。
以下以点击量数据作为需求数据、以预测商品第二天的点击量作为分析目的为例,对本发明实施例进行示例性说明。本例中,基于多时间窗口融合的物品需求数据分析方法包括:
(1)历史点击量数据平滑处理:
对每种商品,查询过去N(N≥7)天中每天的点击量数据,计算N天点击量的均值和标准差,设阈值为均值+3倍标准差;
对超过阈值的日期,分别查看其前两天和后两天的销量数据。若5天中至少有3天的销量大于等于阈值,认为不是由于平时促销导致的销量上升,保留这些数据。否则均值替代超过阈值的数据。若超过阈值的日期无后两天的数据(即该日期最新)或仅有一天数据,使用均值替代销量。
(2)单一时间窗口下的点击量预测:
在某一时间窗口中,使用移动加权平均方法,计算商品s的点击量。计算方法如下:
其中:
W:时间窗口长度;表示从天开始,需要考虑过去多少天内的销售数据。
Csi:第i天商品s的点击量;
如果时间窗口选取的比较短,比如W=7,使用移动平均的方式能够依据过去7天的销售数据预测当天的点击量,能够对过去7天内销量的变化做出较为灵敏的反应,变化较大。极端情况下使用昨天的销量预测今天的销量。时间窗口选取的比较长,则预测值的能够反应较长时间内商品的销量情况,该值会比较稳定。
(3)基于熵权法的多时间窗口预测值融合:
根据运营需求,计算多个时间窗口长度的点击量预测值。一般选取三个时间窗口长度,分别包含表示短期、中期、长期的销售数据,分别表示为S、M、L,如S=7,考虑过期7天内的销售数据。
对所有商品按照(2)中的方法计算不同时间窗口下的点击量预测值,最终得到所有商品的点击量预测值矩阵:
其中:
I:有I种商品;
K:有K个时间窗口。此处K=3,从第一列到最后一列依次为:第一个时间窗口计算的点击量、第二个时间窗口计算的点击量、…、第K个时间窗口计算的点击量;
对每一列进行标准化,方法如下:
计算每个维度的信息熵:
其中n是商品的数量(I种商品中,过滤掉任何一个维度的点击量是0的商品之后,剩余的商品的数量);信息熵能够反应该维度对商品的区分程度,信息熵越小区分程度越小。
计算每个维度的权重:
dk=1-ek
计算商品s的综合得分:
综合得分Ss作为商品s的最终点击量。
在电商仓库的自动化仓库中,需要根据商品的畅销程度安排库存分布,使得畅销品存储位置离工作站更近,较少搬运设备行走距离,提高仓库运营效率。该场景中商品的畅销程度通常用商品的点击量来表示。根据历史数据预测商品未来的点击量是合理安排库存分布的前提。商品的库存分布改变需要一定的时间。若预测点击量值经常发生改变,可能造成不同畅销程度的商品放到同一个货架或者储位中,使得商品的库存分布比较混乱,影响货物搬运、拣选效率,对仓库运营产生负面影响。因此该场景中的点击量预测既要保证短期预测值的准确性,也要保证预测值的稳定性,还要能够反映该商品中长期的畅销程度。本发明基于多时间窗口的商品历史点击量数据预测商品的点击量数据,既能较为准确的预测商品的点击量,又能保证预测值的稳定性,使得商品的预测值在较长一段时间内平滑变动,而非突变。
根据本发明实施例的第二方面,提供一种基于多时间窗口融合的物品需求数据分析装置。图2是根据本发明实施例的基于多时间窗口融合的物品需求数据分析装置的主要模块的示意图,如图2所示,基于多时间窗口融合的物品需求数据分析装置200包括:
获取模块201,获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同;
确定模块202,针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据;
融合模块203,将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。
可选地,根据该时间窗口对应的历史需求数据确定该时间窗口的第一需求数据之前,所述确定模块还用于:
对于所述历史需求数据中每个统计单位内的物品需求数据,若其大于需求阈值,则将该物品需求数据标记为异常值;
当所述异常值满足如下任一条件时,确定所述时间窗口中物品需求数据的均值,并将所述异常值替换为所述均值:
存在所述异常数据对应的统计单位前M个和后M个统计单位内的物品需求数据,且(2M+1)个统计单位中物品需求数据大于等于所述需求阈值的统计单位的数量小于(M+1)个;
不存在所述异常数据对应的统计单位前M个或后M个统计单位内的物品需求数据。
可选地,所述确定模块按照如下公式确定所述需求阈值:
S0=μ+3σ;
式中,S0代表需求阈值,μ代表所述时间窗口中物品需求数据的均值,σ代表所述时间窗口中物品需求数据的标准差。
可选地,所述确定模块采用移动加权平均方法确定各个时间窗口的第一需求数据;和/或,所述融合模块基于熵权法将所述多个时间窗口对应的第一需求数据融合。
根据本发明实施例的第三方面,提供一种基于多时间窗口融合的物品需求数据分析电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例第一方面提供的基于多时间窗口融合的物品需求数据分析方法。
根据本发明实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例第一方面提供的基于多时间窗口融合的物品需求数据分析方法。
图3示出了可以应用本发明实施例的基于多时间窗口融合的物品需求数据分析方法或基于多时间窗口融合的物品需求数据分析装置的示例性系统架构300。
如图3所示,系统架构300可以包括终端设备301、302、303,网络304和服务器305。网络304用以在终端设备301、302、303和服务器305之间提供通信链路的介质。网络304可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备301、302、303通过网络304与服务器305交互,以接收或发送消息等。终端设备301、302、303上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备301、302、303可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器305可以是提供各种服务的服务器,例如对用户利用终端设备301、302、303所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的基于多时间窗口融合的物品需求数据分析方法一般由服务器305执行,相应地,基于多时间窗口融合的物品需求数据分析装置一般设置于服务器305中。
应该理解,图3中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图4,其示出了适于用来实现本发明实施例的终端设备的计算机系统400的结构示意图。图4示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。CPU 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括:获取模块,获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同;确定模块,针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据;融合模块,将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“将所述多个时间窗口对应的第一需求数据融合的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同;针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据;将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。
根据本发明实施例的技术方案,通过对多个不同长度的多个时间窗口的历史需求数据进行分析和融合,既能保证分析结果的准确性,又能保证分析结果的稳定性,使得分析结果在较长一段时间内平滑变动,而非突变。通过对历史需求数据进行平滑处理,能够减小促销等活动对物品需求数据的影响,进一步提高预测准确性。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种基于多时间窗口融合的物品需求数据分析方法,其特征在于,包括:
获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同;
针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据;
将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。
2.如权利要求1所述的物品需求数据分析方法,其特征在于,根据该时间窗口对应的历史需求数据确定该时间窗口的第一需求数据之前,还包括:
对于所述历史需求数据中每个统计单位内的物品需求数据,若其大于需求阈值,则将该物品需求数据标记为异常值;
当所述异常值满足如下任一条件时,确定所述时间窗口中物品需求数据的均值,并将所述异常值替换为所述均值:
存在所述异常数据对应的统计单位前M个和后M个统计单位内的物品需求数据,且(2M+1)个统计单位中物品需求数据大于等于所述需求阈值的统计单位的数量小于(M+1)个;
不存在所述异常数据对应的统计单位前M个或后M个统计单位内的物品需求数据。
3.如权利要求2所述的物品需求数据分析方法,其特征在于,按照如下公式确定所述需求阈值:
S0=μ+3σ;
式中,S0代表需求阈值,μ代表所述历史需求数据的均值,σ代表所述历史需求数据的标准差。
4.如权利要求1所述的物品需求数据分析方法,其特征在于,采用移动加权平均方法确定各个时间窗口的第一需求数据;和/或,基于熵权法将所述多个时间窗口对应的第一需求数据融合。
5.一种基于多时间窗口融合的物品需求数据分析装置,其特征在于,包括:
获取模块,获取多个时间窗口的历史需求数据;所述多个时间窗口的长度不同;
确定模块,针对每个所述时间窗口,根据该时间窗口的历史需求数据确定该时间窗口的第一需求数据;
融合模块,将所述多个时间窗口对应的第一需求数据融合,以实现物品需求数据分析。
6.如权利要求5所述的物品需求数据分析装置,其特征在于,根据该时间窗口对应的历史需求数据确定该时间窗口的第一需求数据之前,所述确定模块还用于:
对于所述历史需求数据中每个统计单位内的物品需求数据,若其大于需求阈值,则将该物品需求数据标记为异常值;
当所述异常值满足如下任一条件时,确定所述时间窗口中物品需求数据的均值,并将所述异常值替换为所述均值:
存在所述异常数据对应的统计单位前M个和后M个统计单位内的物品需求数据,且(2M+1)个统计单位中物品需求数据大于等于所述需求阈值的统计单位的数量小于(M+1)个;
不存在所述异常数据对应的统计单位前M个或后M个统计单位内的物品需求数据。
7.如权利要求6所述的物品需求数据分析装置,其特征在于,所述确定模块按照如下公式确定所述需求阈值:
S0=μ+3σ;
式中,S0代表需求阈值,μ代表所述时间窗口中物品需求数据的均值,σ代表所述时间窗口中物品需求数据的标准差。
8.如权利要求5所述的物品需求数据分析装置,其特征在于,所述确定模块采用移动加权平均方法确定各个时间窗口的第一需求数据;和/或,所述融合模块基于熵权法将所述多个时间窗口对应的第一需求数据融合。
9.一种基于多时间窗口融合的物品需求数据分析电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-4中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910774356.3A CN112418898A (zh) | 2019-08-21 | 2019-08-21 | 基于多时间窗口融合的物品需求数据分析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910774356.3A CN112418898A (zh) | 2019-08-21 | 2019-08-21 | 基于多时间窗口融合的物品需求数据分析方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112418898A true CN112418898A (zh) | 2021-02-26 |
Family
ID=74779226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910774356.3A Pending CN112418898A (zh) | 2019-08-21 | 2019-08-21 | 基于多时间窗口融合的物品需求数据分析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112418898A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019367A (zh) * | 2017-12-28 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 一种统计数据特征的方法和装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100010870A1 (en) * | 2000-12-20 | 2010-01-14 | Karl Millar | System and Method for Tuning Demand Coefficients |
US20140278775A1 (en) * | 2013-03-14 | 2014-09-18 | Teradata Corporation | Method and system for data cleansing to improve product demand forecasting |
CN108537544A (zh) * | 2018-04-04 | 2018-09-14 | 中南大学 | 一种交易系统实时监控方法及其监控系统 |
CN109656793A (zh) * | 2018-11-22 | 2019-04-19 | 安徽继远软件有限公司 | 一种基于多源异构数据融合的信息系统性能立体监测方法 |
CN109685583A (zh) * | 2019-01-10 | 2019-04-26 | 博拉网络股份有限公司 | 一种基于大数据的供应链需求预测方法 |
CN109741082A (zh) * | 2018-11-29 | 2019-05-10 | 杭州览众数据科技有限公司 | 一种基于时间序列分解的季节性商品需求预测方法 |
CN109800483A (zh) * | 2018-12-29 | 2019-05-24 | 北京城市网邻信息技术有限公司 | 一种预测方法、装置、电子设备和计算机可读存储介质 |
CN109978208A (zh) * | 2017-12-28 | 2019-07-05 | 顺丰科技有限公司 | 一种时序数据预测方法、装置以及计算机存储介质 |
CN110033292A (zh) * | 2018-01-12 | 2019-07-19 | 北京京东尚科信息技术有限公司 | 信息输出方法和装置 |
-
2019
- 2019-08-21 CN CN201910774356.3A patent/CN112418898A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100010870A1 (en) * | 2000-12-20 | 2010-01-14 | Karl Millar | System and Method for Tuning Demand Coefficients |
US20140278775A1 (en) * | 2013-03-14 | 2014-09-18 | Teradata Corporation | Method and system for data cleansing to improve product demand forecasting |
CN109978208A (zh) * | 2017-12-28 | 2019-07-05 | 顺丰科技有限公司 | 一种时序数据预测方法、装置以及计算机存储介质 |
CN110033292A (zh) * | 2018-01-12 | 2019-07-19 | 北京京东尚科信息技术有限公司 | 信息输出方法和装置 |
CN108537544A (zh) * | 2018-04-04 | 2018-09-14 | 中南大学 | 一种交易系统实时监控方法及其监控系统 |
CN109656793A (zh) * | 2018-11-22 | 2019-04-19 | 安徽继远软件有限公司 | 一种基于多源异构数据融合的信息系统性能立体监测方法 |
CN109741082A (zh) * | 2018-11-29 | 2019-05-10 | 杭州览众数据科技有限公司 | 一种基于时间序列分解的季节性商品需求预测方法 |
CN109800483A (zh) * | 2018-12-29 | 2019-05-24 | 北京城市网邻信息技术有限公司 | 一种预测方法、装置、电子设备和计算机可读存储介质 |
CN109685583A (zh) * | 2019-01-10 | 2019-04-26 | 博拉网络股份有限公司 | 一种基于大数据的供应链需求预测方法 |
Non-Patent Citations (4)
Title |
---|
冯雪;张金锁;邹绍辉;: "基于多源信息融合的能源需求预测模型研究综述", 统计与决策, no. 23, pages 29 - 32 * |
刘琦等编著: "《应用统计学》", vol. 2009, 31 October 2009, 国防科技大学出版社, pages: 349 * |
胡伟、赵文会: "基于时间窗口和自适应加权的能源互联网数据融合方法", 《系统管理学报》, vol. 25, no. 5, pages 907 - 913 * |
钱斌华著: "《探索税收与经济的互动性:税收指数的模型与实证》", vol. 2017, 31 July 2017, 立信会计出版社, pages: 64 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019367A (zh) * | 2017-12-28 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 一种统计数据特征的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110751497B (zh) | 一种商品补货方法和装置 | |
CN110880084A (zh) | 一种仓库补货的方法和装置 | |
CN109961198B (zh) | 关联信息生成方法和装置 | |
CN107274209A (zh) | 预测促销活动销售数据的方法和装置 | |
CN113095893A (zh) | 确定物品销量的方法和装置 | |
CN109961299A (zh) | 数据分析的方法和装置 | |
CN110738508B (zh) | 一种数据分析方法和装置 | |
CN110738436A (zh) | 一种确定可用库存的方法和装置 | |
CN110827101B (zh) | 一种店铺推荐的方法和装置 | |
CN113793081A (zh) | 仓储监控方法、装置、计算机可读介质及电子设备 | |
CN114663015A (zh) | 补货方法和装置 | |
CN110827102B (zh) | 用于调货比价的方法和装置 | |
CN112825178A (zh) | 一种预测用户性别画像的方法和装置 | |
CN113988768A (zh) | 一种库存的确定方法和装置 | |
CN112102043B (zh) | 物品推荐页面生成方法、装置、电子设备和可读介质 | |
CN112989276B (zh) | 信息推送系统的评价方法和装置 | |
CN112418898A (zh) | 基于多时间窗口融合的物品需求数据分析方法和装置 | |
CN110490682B (zh) | 分析商品属性的方法和装置 | |
CN111833085A (zh) | 一种计算物品价格的方法和装置 | |
CN110766431A (zh) | 判断用户对优惠券是否敏感的方法和装置 | |
CN110858335A (zh) | 一种计算促销弹性的方法和装置 | |
CN110838019A (zh) | 确定试用品发放人群的方法和装置 | |
CN115099865A (zh) | 一种数据处理方法和装置 | |
CN110084541B (zh) | 用于预测供应商送货时长的方法和装置 | |
CN112819555A (zh) | 一种物品推荐方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |