CN110766232B - 动态预测方法及其系统 - Google Patents
动态预测方法及其系统 Download PDFInfo
- Publication number
- CN110766232B CN110766232B CN201911045798.0A CN201911045798A CN110766232B CN 110766232 B CN110766232 B CN 110766232B CN 201911045798 A CN201911045798 A CN 201911045798A CN 110766232 B CN110766232 B CN 110766232B
- Authority
- CN
- China
- Prior art keywords
- time period
- time
- traffic
- distribution
- fluctuation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Abstract
本申请公开了一种动态预测方法及其系统。该方法包括:获取N个第一时间周期中的业务数据,其中每一个第一时间周期包括M个第二时间周期;根据所述业务数据计算每个第二时间周期的业务量在所属的第一时间周期中的分布占比;根据各个所述分布占比计算N‑1个波动指标;选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比;根据所述M个平均分布占比进行预测。
Description
技术领域
本说明书涉及大数据处理技术领域。
背景技术
目前,在许多应用场景下都需要对于涉及时间序列的现实场景进行预测,例如,预测某个营销活动的交易量,或者预测用户对某个网站的访问次数,等等。然而,由于历史数据可能掺杂了许多因素,并非用到的历史数据越多预测会越准确,如何找到其中对当前预测最有价值的历史数据一直是困扰本领域技术人员的困难问题。
发明内容
本说明书提供了一种动态预测方法及其系统,可以更加准确地对于涉及时间序列的现实场景进行预测。
本申请公开了一种动态预测方法,包括:
获取N个第一时间周期中的业务数据,其中每一个第一时间周期包括M个第二时间周期,N和M为大于1的整数;
根据所述业务数据计算每个第二时间周期的业务量在所属的第一时间周期中的分布占比;
根据各个所述分布占比计算N-1个波动指标,其中第i个波动指标对应第T-1个第一时间周期到第T-i-1个第一时间周期的波动指标,i是从1到N-1的整数,T代表当前时刻所属的第一时间周期;
选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比;
根据所述M个平均分布占比进行预测。
在一个优选例中,所述根据各个所述分布占比计算N-1个波动指标,进一步包括:
通过以下方式计算第i个波动指标:
对于从第T-1个第一时间周期到第T-i-1个第一时间周期所构成的时间跨度,获取该时间跨度中所有第二时间周期的分布占比;
根据所述时间跨度中各个分部占比,计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的离散程度指标,得到M个离散程度指标;
将上述M个离散程度指标的平均值作为所述第i个波动指标。
在一个优选例中,所述离散程度指标是以下之一:标准差,极差,平均差。
在一个优选例中,所述根据所述M个平均分布占比进行预测,将进一步包括:
获取第T个第一时间周期中前L个第二时间周期的业务量;
对所述前L个第二时间周期的业务量求和得到第一累积值,对所述M个平均分布占比中的前L个求和得到第二累积值,将所述第一累积值除以所述第二累积值得到第T个第一时间周期的业务量的预测值;
将所述M个平均分布占比中的后M-L个平均分布占比分别乘以所述第T个第一时间周期的业务量的预测值,得到第T个第一时间周期中的后M-L个第二时间周期的业务量的预测值。
在一个优选例中,所述方法用于网站的访问次数预测,所述业务量是网站的访问次数。
在一个优选例中,所述方法用于营销活动的交易量预测,所述业务量是交易量。
在一个优选例中,所述第一时间周期是一天,所述第二时间周期是一个小时。
本申请还公开了一种动态预测系统包括:
业务数据获取单元,用于获取N个第一时间周期中的业务数据,其中每一个第一时间周期包括M个第二时间周期,N和M为大于1的整数;
分布占比计算单元,用于根据所述业务数据计算每个第二时间周期的业务量在所属的第一时间周期中的分布占比;
波动指标计算单元,用于根据各个所述分布占比计算N-1个波动指标,其中第i个波动指标对应第T-1个第一时间周期到第T-i-1个第一时间周期的波动指标,i是从1到N-1的整数,T代表当前时刻所属的第一时间周期;
平均分布占比计算单元,用于选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比;
预测单元,用于根据所述M个平均分布占比进行预测。
在一个优选例中,波动指标计算单元通过以下方式计算第i个波动指标:
对于从第T-1个第一时间周期到第T-i-1个第一时间周期所构成的时间跨度,获取该时间跨度中所有第二时间周期的分布占比;
根据所述时间跨度中各个分部占比,计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的离散程度指标,得到M个离散程度指标;
将上述M个离散程度指标的平均值作为所述第i个波动指标。
在一个优选例中,所述离散程度指标是以下之一:标准差,极差,平均差。
在一个优选例中,所述预测单元进一步包括:
业务量获取子单元,用于获取第T个第一时间周期中前L个第二时间周期的业务量;
总业务量预测子单元,用于对所述前L个第二时间周期的业务量求和得到第一累积值,对所述M个平均分布占比中的前L个求和得到第二累积值,将所述第一累积值除以所述第二累积值得到第T个第一时间周期的业务量的预测值;
分业务量预测子单元,用于将所述M个平均分布占比中的后M-L个平均分布占比分别乘以所述第T个第一时间周期的业务量的预测值,得到第T个第一时间周期中的后M-L个第二时间周期的业务量的预测值。
在一个优选例中,所述系统用于网站的访问次数预测,所述业务量是网站的访问次数。
在一个优选例中,所述系统用于营销活动的交易量预测,所述业务量是交易量。
在一个优选例中,所述第一时间周期是一天,所述第二时间周期是一个小时。
本申请还公开了一种动态预测系统包括:
存储器,用于存储计算机可执行指令;以及,
处理器,与所述存储器耦合,用于在执行所述计算机可执行指令时实现如前文描述的方法中的步骤。
本申请还公开了一种计算机可读存储介质所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
本说明书实施方式中,可以更加准确地对于涉及时间序列的现实场景进行预测。
本说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本申请所有可能的技术特征的个合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本说明书上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相个合,从而构成各种新的技术方案(这些技术方案均应该视为在本说明书中已经记载),除非这种技术特征的个合在技术上是不可行的。例如,在一个例子中公开了特征A+B+C,在另一个例子中公开了特征A+B+D+E,而特征C和D是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征E技术上可以与特征C相个合,则,A+B+C+D的方案因技术不可行而应当不被视为已经记载,而A+B+C+E的方案应当视为已经被记载。
附图说明
图1是根据本说明书第一实施方式的动态预测方法的流程示意图;
图2是根据本说明书第一实施方式的动态预测方法的细节流程示意图;
图3是根据本说明书第一实施方式的动态预测方法的另一个细节流程示意图;
图4是根据本说明书第二实施方式的动态预测系统的结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
部分概念的说明:
波动指标:用于评价一个数据波动性的指标。例如标准差,或标准差的平均值等指标。
平均值:代表数据一般水平的统计指标,包括算术平均数、调和平均数、几何平均数、中位数和众数等。
下面对于本说明书的部分创新点进行说明:
要解决的一个问题是使用时间分布占比,如小时分布占比,来预测业务量时,到底用几天的数据来形成合理的小时分布占比呢?是用昨日一天的,还是用历史全量的?一天和一小时都是时间周期,一天是本说明书中第一时间周期的一个典型例子,一小时是第二时间周期的一个典型例子。
发明人认为,针对某个特定的业务,不能一概而论地说用哪天的数据来形成小时分布占比最合适,而要从历史数据中找出小时分布占比的波动最小的日期区间(即最小波动时间区间),用这个日期区间中的历史数据进行预测。
波动最小的日期区间的查找方式如下:先根据业务数据计算N日中每一个小时在该小时所属那一天的分布占比,然后根据每小时的分布占比计算N-1个波动指标。设今日为T日,第1个波动指标对应T-1日到T-2日的时间跨度,用T-1日到T-2日中的每小时分布占比计算;第2个波动指标对应T-1日到T-3日的时间跨度,用T-1日到T-3日中的每小时分布占比计算;……,以此类推。每一个波动指标对应一个时间跨度(例如第4个波动指标对应T-1日到T-5日的时间跨度),计算该时间跨度中每天相同位置的小时的分布占比标准差(也可以用其他离散程度指标),例如计算T-1日到T-5日中每天第1个小时的分布占比标准差、第2个小时分布占比标准差、……以此类推,得到24个小时的分布占比标准差,求其平均值,作为第4个波动指标。从N-1个波动指标中选出最小的那个,该波动指标对应的时间跨度就是波动最小的日期区间。
下面将结合附图对本说明书的实施方式作进一步地详细描述。
本说明书的第一实施方式涉及一种动态预测方法,其流程如图1所示,该方法包括以下步骤:
步骤110:获取N个第一时间周期中的业务数据,其中每一个第一时间周期包括M个第二时间周期,N和M为大于1的整数;
步骤120:根据所述业务数据计算每个第二时间周期的业务量在所属的第一时间周期中的分布占比;
步骤130:根据各个所述分布占比计算N-1个波动指标,其中第i个波动指标对应第T-1个第一时间周期到第T-i-1个第一时间周期的波动指标,i是从1到N-1的整数,T代表当前时刻所属的第一时间周期;
步骤140:选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比;
步骤150:根据所述M个平均分布占比进行预测。
优选地,上述方法可以用于网站的访问次数预测,所述业务量是网站的访问次数。
优选地,上述方法还可以用于营销活动的交易量预测,所述业务量是交易量。
下面对每一个步骤详细的解释说明。
对于步骤110:
优选地,所述第一时间周期是一天,所述第二时间周期是一个小时。需指出,在其他实施例中,第一数据周期和第二时间周期也可以是其他的时间单位,例如第一时间周期是一周,第二时间周期是一天,又如,第一时间周期是1天,第二时间周期是15分钟,在此不做赘述。
对于步骤120:
具体的,每个第二时间周期的业务量在所属的第一时间周期中的分布占比,是指统计每个第二时间周期的业务量,并统计每个第一时间周期的业务量,因为每一个第一时间周期中包括M个第二时间周期,所以可以将一个第一时间周期中各个第二时间周期的业务量分别除以该第一时间周期的业务量,的到M个分布占比,分别对应该第一时间周期中的M个第二时间周期。举例来说,某日中各个小时的交易量分别为60、40、30、70、50、50、50、50、50、50、100、30、30、20、20、20、20、20、20、20、50、50、50、50。那么该日各个小时的交易量分布占比分别为6%、4%、3%、7%、5%、5%、5%、5%、5%、5%、10%、3%、3%、2%、2%、2%、2%、2%、2%、2%、5%、5%、5%、5%。
对于步骤130:
具体的,波动指标是指用于评价一个数据波动性的指标。例如标准差,或标准差的平均值等指标。例如,如图2所示,可以通过以下方式计算第i个波动指标:
步骤1302:对于从第T-1个第一时间周期到第T-i-1个第一时间周期所构成的时间跨度,获取该时间跨度中所有第二时间周期的分布占比。时间跨度可以是例如从T-1日到T-2日,或从T-1日到T-5日等。
步骤1304:根据所述时间跨度中各个分布占比,计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的离散程度指标,得到M个离散程度指标。
离散度指标可以是标准差、极差、平均差等等。
步骤1306:将上述M个离散程度指标的平均值作为所述第i个波动指标。
对于步骤140:选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比。
可以这样理解,M个平均分布占比代表平均而言一个第一时间周期中每一个第二时间周期业务量的平均占比。举例来说,最小波动时间区间中有7天,就计算一天中第一个小时(0:00到1:00)在7天中的分布占比的平均值,或者说将7天中7个0:00到1:00的分布占比求平均,得到一天中第一个小时的平均分布占比。以此类推得到一天中第二个小时,第三个小时,一直到第二十四个小时的平均分布占比,一共24个平均分布占比。
更具体的说,在本步骤中,筛选出每小时标准差的均值最小的日期区间,因为每份每小时标准差是由24个数值个成,为了比较每份每小时标准差的大小,先对每份每小时标准差计算均值(将24个数值变为1个数值),再选择均值最小的那份每小时标准差对应日期区间。由于每次预测都会有新的历史数据加入进来,新加入的历史数据会影响标准差的大小,从而最终影响了选择的日期区间,即,动态筛选训练数据。换句话说,在本步骤中,先确定哪一个日期区间最稳定,再在这个日期区间中确定每一个小时的平均小时分布占比。
进一步的,举例来说,在进行时序预测时,每段时间都会受到不同事件的影响。比如当业务量是娱乐网站pv时,如果过去一周是国庆,大家每天任何时候都能上网了解娱乐资讯,那么网站pv的小时分布会非常均匀。而国庆结束后的第一周,大家白天要上班,晚上才能上网了解娱乐资讯。国庆和上班时每天的小时分布必定发生变化。在这种情况下,当国庆后第二周做预测时,就不可能基于国庆时的数据进行预测,需要基于国庆后第一周的数据做第二周的预测。由此可见,需要这样动态筛选数据。总而言之,在本说明书的实施例中,考虑到了每段时间都会受不同事件的影响,在做预测时需要尽可能筛选出与需要预测的日期相似的数据集。
对于步骤150:
优选地,如图3所示,所述根据所述M个平均分布占比进行预测,将进一步包括一下子步骤:
步骤1502:获取第T个第一时间周期中前L个第二时间周期的业务量;
步骤1504:对所述前L个第二时间周期的业务量求和得到第一累积值,对所述M个平均分布占比中的前L个求和得到第二累积值,将所述第一累积值除以所述第二累积值得到第T个第一时间周期的业务量的预测值;
步骤1506:将所述M个平均分布占比中的后M-L个平均分布占比分别乘以所述第T个第一时间周期的业务量的预测值,得到第T个第一时间周期中的后M-L个第二时间周期的业务量的预测值。如果只需要预测第一时间周期的业务量,也可以不执行步骤1506。
举例来说,今日已有数据是0:00到2:00两个小时的数据,则用这两个小时的总数,除以平均分布占比中0:00到1:00和1:00到2:00之和,即可得到预测的今日业务量的总数。再用今日业务量的总数乘以2:00到3:00的平均分布占比得到2:00到3:00的业务量预测值,用今日业务量的总数乘以3:00到4:00的平均分布占比得到3:00到4:00的业务量预测值,……,以此类推,可以得到2:00之后各个小时的业务量预测值。
上述实施例从历史数据中找出小时分布占比的波动最小的日期区间(即最小波动时间区间),用这个日期区间中的历史数据进行预测,可以更加准确地对于涉及时间序列的现实场景进行预测。
本说明书的第二实施方式涉及一种动态预测系统,其结构如图4所示,该动态预测系统包括:
业务数据获取单元,用于获取N个第一时间周期中的业务数据,其中每一个第一时间周期包括M个第二时间周期,N和M为大于1的整数。其中,优选地,所述第一时间周期是一天,所述第二时间周期是一个小时。优选地,在其他实施例中,第一数据周期和第二时间周期也可以是其他的时间单位,例如第一时间周期是一周,第二时间周期是一天,又如,第一时间周期是一天,第二时间周期是十五分钟。
分布占比计算单元,用于根据所述业务数据计算每个第二时间周期的业务量在所属的第一时间周期中的分布占比。
波动指标计算单元,用于根据各个所述分布占比计算N-1个波动指标,其中第i个波动指标对应第T-1个第一时间周期到第T-i-1个第一时间周期的波动指标,i是从1到N-1的整数,T代表当前时刻所属的第一时间周期。优选地,波动指标计算单元通过以下方式计算第i个波动指标:对于从第T-1个第一时间周期到第T-i-1个第一时间周期所构成的时间跨度,获取该时间跨度中所有第二时间周期的分布占比;根据所述时间跨度中各个分布占比,计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的离散程度指标,得到M个离散程度指标;将上述M个离散程度指标的平均值作为所述第i个波动指标。其中,优选地,所述离散程度指标是以下之一:标准差,极差,平均差。
平均分布占比计算单元,用于选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比;
预测单元,用于根据所述M个平均分布占比进行预测。优选地,所述预测单元进一步包括:业务量获取子单元,用于获取第T个第一时间周期中前L个第二时间周期的业务量;总业务量预测子单元,用于对所述前L个第二时间周期的业务量求和得到第一累积值,对所述M个平均分布占比中的前L个求和得到第二累积值,将所述第一累积值除以所述第二累积值得到第T个第一时间周期的业务量的预测值;分业务量预测子单元,用于将所述M个平均分布占比中的后M-L个平均分布占比分别乘以所述第T个第一时间周期的业务量的预测值,得到第T个第一时间周期中的后M-L个第二时间周期的业务量的预测值。
优选地,所述系统可以用于网站的访问次数预测,所述业务量是网站的访问次数。
优选地,所述系统还可以用于营销活动的交易量预测,所述业务量是交易量。
第一实施方式是与本实施方式相对应的方法实施方式,第一实施方式中的技术细节可以应用于本实施方式,本实施方式中的技术细节也可以应用于第一实施方式。
需要说明的是,本领域技术人员应当理解,上述动态预测系统的实施方式中所示的各模块的实现功能可参照前述动态预测方法的相关描述而理解。上述动态预测系统的实施方式中所示的各模块的功能可通过运行于处理器上的程序(可执行指令)而实现,也可通过具体的逻辑电路而实现。本说明书实施例上述动态预测系统如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本说明书各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本说明书实施例不限制于任何特定的硬件和软件结合。
相应地,本说明书实施方式还提供一种计算机可读存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本说明书的各方法实施方式。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于,相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
此外,本说明书实施方式还提供一种动态预测系统,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。
在一个实施例中,该计算机可执行指令可以用于:获取N个第一时间周期中的业务数据,其中每一个第一时间周期包括M个第二时间周期,N和M为大于1的整数;根据所述业务数据计算每个第二时间周期的业务量在所属的第一时间周期中的分布占比;根据各个所述分布占比计算N-1个波动指标,其中第i个波动指标对应第T-1个第一时间周期到第T-i-1个第一时间周期的波动指标,i是从1到N-1的整数,T代表当前时刻所属的第一时间周期;选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比;根据所述M个平均分布占比进行预测。
在一个实施例中,该处理器可以是中央处理单元(Central Processing Unit,简称“CPU”),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,简称“DSP”)、专用集成电路(Application Specific Integrated Circuit,简称“ASIC”)等。前述的存储器可以是只读存储器(read-only memory,简称“ROM”)、随机存取存储器(randomaccess memory,简称“RAM”)、快闪存储器(Flash)、硬盘或者固态硬盘等。本发明各实施方式所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。在一个实施例中,该动态预测系统还包括总线和通信接口。处理器、存储器和通信接口都通过总线相互连接。通信接口可以是无线通信接口也可以是有线通信接口,用于使得处理器能够与其他的装置通信。
需要说明的是,在本专利的申请文件中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利的申请文件中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。
在本说明书提及的所有文献都被认为是整体性地包括在本说明书的公开内容中,以便在必要时可以作为修改的依据。此外应理解,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描述的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
Claims (10)
1.一种动态预测方法,所述方法用于网站的访问次数预测,对应的业务量是网站的访问次数,或者所述方法用于营销活动的交易量预测,对应的业务量是交易量,所述方法包括:
获取N个第一时间周期中的业务数据,其中每一个第一时间周期包括M个第二时间周期,N和M为大于1的整数;
根据所述业务数据计算每个第二时间周期的业务量在所属的第一时间周期中的分布占比;
根据各个所述分布占比计算N-1个波动指标,其中第i个波动指标对应第T-1个第一时间周期到第T-i-1个第一时间周期的波动指标,i是从1到N-1的整数,T代表当前时刻所属的第一时间周期;
选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比;
根据所述M个平均分布占比进行预测,
其中,所述根据各个所述分布占比计算N-1个波动指标,包括:通过以下方式计算第i个波动指标:对于从第T-1个第一时间周期到第T-i-1个第一时间周期所构成的时间跨度,获取该时间跨度中所有第二时间周期的分布占比;根据所述时间跨度中各个分布占比,计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的离散程度指标,得到M个离散程度指标;将上述M个离散程度指标的平均值作为所述第i个波动指标。
2.如权利要求1所述的动态预测方法,其中,所述离散程度指标是以下之一:标准差,极差,平均差。
3.如权利要求1所述的动态预测方法,其中,所述根据所述M个平均分布占比进行预测,将进一步包括:
获取第T个第一时间周期中前L个第二时间周期的业务量;
对所述前L个第二时间周期的业务量求和得到第一累积值,对所述M个平均分布占比中的前L个求和得到第二累积值,将所述第一累积值除以所述第二累积值得到第T个第一时间周期的业务量的预测值;
将所述M个平均分布占比中的后M-L个平均分布占比分别乘以所述第T个第一时间周期的业务量的预测值,得到第T个第一时间周期中的后M-L个第二时间周期的业务量的预测值。
4.如权利要求1-3任意一项所述的动态预测方法,其中,所述第一时间周期是一天,所述第二时间周期是一个小时。
5.一种动态预测系统,所述系统用于网站的访问次数预测,对应的业务量是网站的访问次数,或者所述系统用于营销活动的交易量预测,对应的业务量是交易量,所述系统包括:
业务数据获取单元,用于获取N个第一时间周期中的业务数据,其中每一个第一时间周期包括M个第二时间周期,N和M为大于1的整数;
分布占比计算单元,用于根据所述业务数据计算每个第二时间周期的业务量在所属的第一时间周期中的分布占比;
波动指标计算单元,用于根据各个所述分布占比计算N-1个波动指标,其中第i个波动指标对应第T-1个第一时间周期到第T-i-1个第一时间周期的波动指标,i是从1到N-1的整数,T代表当前时刻所属的第一时间周期;
平均分布占比计算单元,用于选择最小的波动指标对应的时间区间作为最小波动时间区间,根据该最小波动时间区间中的各个所述分布占比计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的平均值,得到M个平均分布占比;
预测单元,用于根据所述M个平均分布占比进行预测,
其中,波动指标计算单元通过以下方式计算第i个波动指标:对于从第T-1个第一时间周期到第T-i-1个第一时间周期所构成的时间跨度,获取该时间跨度中所有第二时间周期的分布占比;根据所述时间跨度中各个分布占比,计算在第一时间周期中处于相同位置的各个第二时间周期的分布占比的离散程度指标,得到M个离散程度指标;将上述M个离散程度指标的平均值作为所述第i个波动指标。
6.如权利要求5所述的动态预测系统,其中,所述离散程度指标是以下之一:标准差,极差,平均差。
7.如权利要求5所述的动态预测系统,其中,所述预测单元进一步包括:
业务量获取子单元,用于获取第T个第一时间周期中前L个第二时间周期的业务量;
总业务量预测子单元,用于对所述前L个第二时间周期的业务量求和得到第一累积值,对所述M个平均分布占比中的前L个求和得到第二累积值,将所述第一累积值除以所述第二累积值得到第T个第一时间周期的业务量的预测值;
分业务量预测子单元,用于将所述M个平均分布占比中的后M-L个平均分布占比分别乘以所述第T个第一时间周期的业务量的预测值,得到第T个第一时间周期中的后M-L个第二时间周期的业务量的预测值。
8.如权利要求5-7中任意一项所述的动态预测系统,其中,所述第一时间周期是一天,所述第二时间周期是一个小时。
9.一种动态预测系统,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,与所述存储器耦合,用于在执行所述计算机可执行指令时实现如权利要求1至4中任意一项所述的方法中的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1至4中任意一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911045798.0A CN110766232B (zh) | 2019-10-30 | 2019-10-30 | 动态预测方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911045798.0A CN110766232B (zh) | 2019-10-30 | 2019-10-30 | 动态预测方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110766232A CN110766232A (zh) | 2020-02-07 |
CN110766232B true CN110766232B (zh) | 2022-04-29 |
Family
ID=69334596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911045798.0A Active CN110766232B (zh) | 2019-10-30 | 2019-10-30 | 动态预测方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110766232B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340281B (zh) * | 2020-02-20 | 2022-06-03 | 支付宝(杭州)信息技术有限公司 | 预测模型训练方法及装置 |
CN112215444B (zh) * | 2020-12-09 | 2021-04-02 | 平安科技(深圳)有限公司 | 基于分布曲线的预测方法、装置、设备及存储介质 |
CN114339967A (zh) * | 2021-12-24 | 2022-04-12 | 中国电信股份有限公司 | 基站业务量的预测方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291705A (zh) * | 2016-03-30 | 2017-10-24 | 王斌 | 一种大数据发展趋势的预算方法和系统 |
CN107301570A (zh) * | 2017-07-13 | 2017-10-27 | 北京小度信息科技有限公司 | 业务量预测方法、异常业务量检测方法、装置和电子设备 |
CN109685583A (zh) * | 2019-01-10 | 2019-04-26 | 博拉网络股份有限公司 | 一种基于大数据的供应链需求预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170140278A1 (en) * | 2015-11-18 | 2017-05-18 | Ca, Inc. | Using machine learning to predict big data environment performance |
-
2019
- 2019-10-30 CN CN201911045798.0A patent/CN110766232B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291705A (zh) * | 2016-03-30 | 2017-10-24 | 王斌 | 一种大数据发展趋势的预算方法和系统 |
CN107301570A (zh) * | 2017-07-13 | 2017-10-27 | 北京小度信息科技有限公司 | 业务量预测方法、异常业务量检测方法、装置和电子设备 |
CN109685583A (zh) * | 2019-01-10 | 2019-04-26 | 博拉网络股份有限公司 | 一种基于大数据的供应链需求预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110766232A (zh) | 2020-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108289121B (zh) | 营销信息的推送方法及装置 | |
CN110766232B (zh) | 动态预测方法及其系统 | |
Chen et al. | An empirical study of demand forecasting of non-volatile memory for smart production of semiconductor manufacturing | |
CN111310784B (zh) | 资源数据的处理方法及装置 | |
CN110490635B (zh) | 商户菜品交易预测及备餐方法及装置 | |
CN116050947A (zh) | 车辆调度效果的评价方法、装置、计算机设备和存储介质 | |
CN110490595B (zh) | 一种风险控制方法和装置 | |
Hyndman | Forecasting: An Overview. | |
CN108235360A (zh) | 甄别用户的方法及设备 | |
CN110674178A (zh) | 构建用户画像标签的方法及其系统 | |
CN114708007A (zh) | 一种用于门店销售计划的智能分解方法及系统 | |
CN108243037B (zh) | 网站流量异常确定方法及装置 | |
CN108154377B (zh) | 广告作弊预测方法及装置 | |
CN108241643B (zh) | 关键词的指标数据分析方法及装置 | |
CN114968028A (zh) | 基于用户行为分析动态改变菜单布局的方法、设备及介质 | |
CN113919873A (zh) | 市场容量的确定方法、装置、设备及存储介质 | |
Maleta | Methods for Determining the Impact of the Temporal Trend in the Valuation of Land Property | |
WO2013055257A1 (ru) | Способ прогноза целевого показателя событий по неограниченному количеству характеристик | |
CN114756731A (zh) | 广告渠道数据的处理方法及装置、存储介质、电子设备 | |
CN111164633B (zh) | 一种评分卡模型的调整方法、装置、服务器及存储介质 | |
CN108334519A (zh) | 一种用户画像中的用户标签获取方法及装置 | |
CN112836971A (zh) | 配额资源的确定方法和装置、电子设备和存储介质 | |
CN111291174A (zh) | 基于区块链的线上阅读文章资讯排序方法及设备、介质 | |
CN108629610B (zh) | 推广信息曝光量的确定方法和装置 | |
CN112509164A (zh) | 一种出勤打卡方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |