CN107016564A - 一种进行指标预测的方法和设备 - Google Patents

一种进行指标预测的方法和设备 Download PDF

Info

Publication number
CN107016564A
CN107016564A CN201611070657.0A CN201611070657A CN107016564A CN 107016564 A CN107016564 A CN 107016564A CN 201611070657 A CN201611070657 A CN 201611070657A CN 107016564 A CN107016564 A CN 107016564A
Authority
CN
China
Prior art keywords
target indicator
target
forecast model
length
indicator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611070657.0A
Other languages
English (en)
Inventor
冯银付
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201611070657.0A priority Critical patent/CN107016564A/zh
Publication of CN107016564A publication Critical patent/CN107016564A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例涉及计算机技术领域,特别涉及一种进行指标预测的方法和设备,用以解决现有技术中存在的对象预测的方法的预测准确率比较低的问题。本申请实施例利用滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,从根据确定的多个目标指标子集,确定的预测模型集合中选择至少一个预测模型集合,并利用选择的至少一个预测模型集合预测所述对象的所述目标指标。采用本申请实施例的方案可以提高对对象的指标预测的准确率。

Description

一种进行指标预测的方法和设备
技术领域
本申请涉及计算机技术领域,特别涉及一种进行指标预测的方法和设备。
背景技术
对象销量预估是在指定时长内对某一个对象的具体销量进行预测。准确的对象销量预估,可以对库存调度、营销商品的选品和类目商品排序等提供比较大的帮助。
目前商品销量预测时一般采用时间序列预测法。
时间序列预测法是对对象的历史情况进行分析,来预测事物发展的趋势。该方法是将对象的历史销售数据按照时间进行排列,然后运用数理统计方法,来预测推断出在未来时间段内商品的销售情况。
除了时间序列预测法,还有因素回归分析法、混合统计分析法等几种方式。
不管那些方式目前商品销量预测所依赖的是曲线的平滑思想,由于基于对象销量随时间变化的曲线是比较平滑的曲线,而实际中对象销量的曲线通常是波动比较明显的,整条曲线上并不满足平滑性假设前提。因此目前对象销量预测的方法的预测准确率比较低。
综上所述,目前对象预测的方法的预测准确率比较低。
发明内容
本申请提供一种进行指标预测的方法和设备,用以解决现有技术中存在的对象预测的方法的预测准确率比较低的问题。
本申请实施例提供的一种进行指标预测的方法,该方法包括:
针对任意一个长度的滑动窗口,利用所述长度的滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,其中所述目标指标子集中包括获取的至少一个目标指标;
根据确定的多个目标指标子集,确定所述长度的滑动窗口对应的预测模型集合;
从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合;
利用选择的至少一个预测模型集合预测所述对象的所述目标指标。
本申请实施例提供的一种进行指标预测的设备,该设备包括:
子集确定模块,用于针对任意一个长度的滑动窗口,利用所述长度的滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,其中所述目标指标子集中包括获取的至少一个目标指标;
模型确定模块,用于根据确定的多个目标指标子集,确定所述长度的滑动窗口对应的预测模型集合;
选择模块,用于从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合;
预测模块,用于利用选择的至少一个预测模型集合预测所述对象的所述目标指标。
本申请实施例提供的一种进行指标预测的方法,该方法包括:
根据获取的目标时长内对象的目标指标,将对象分成多个对象集合;
根据多个目标指标子集,确定所述对象集合对应的预测模型集合,其中所述目标指标子集中包括获取的目标时长内对象集合中的对象的目标指标,所述预测模型集合中的预测模块对应不同长度的滑动窗口;
根据所述对象集合对应的预测模型集合,预测所述对象的所述目标指标。
本申请实施例提供的一种进行指标预测的设备,该设备包括:
划分模块,用于根据获取的目标时长内对象的目标指标,将对象分成多个对象集合;
集合确定模块,用于根据多个目标指标子集,确定所述对象集合对应的预测模型集合,其中所述目标指标子集中包括获取的目标时长内对象集合中的对象的目标指标,所述预测模型集合中的预测模块对应不同长度的滑动窗口;
处理模块,用于根据所述对象集合对应的预测模型集合,预测所述对象的所述目标指标。
本申请实施例提供的一种方案中利用滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,从根据确定的多个目标指标子集,确定的预测模型集合中选择至少一个预测模型集合,并利用选择的至少一个预测模型集合预测所述对象的所述目标指标。由于借助滑动窗口切分目标指标,构造多个目标指标子集,并从多个目标指标子集上的预测模型中选择预测模型,从而提高了对对象的指标预测的准确率。
本申请实施例提供的另一种方案中根据获取的目标时长内对象的目标指标,将对象分成多个对象集合,根据多个目标指标子集,确定所述对象集合对应的预测模型集合,其中所述目标指标子集中包括获取的目标时长内对象集合中的对象的目标指标,所述预测模型集合中的预测模块对应不同长度的滑动窗口;根据所述对象集合对应的预测模型集合,预测所述对象的所述目标指标。由于采用包括获取的目标时长内对象集合中的对象的目标指标的目标指标子集确定的预测模型集合进行预测,并且预测模型集合中的预测模块对应不同长度的滑动窗口,从而提高了对对象的指标预测的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例进行指标预测的方法流程示意图;
图2为本申请实施例进行指标预测的完整方法流程示意图;
图3为本申请实施例进行指标预测的设备结构示意图;
图4为本申请实施例另一种进行指标预测的方法流程示意图;
图5为本申请实施例另一种进行指标预测的设备结构示意图。
具体实施方式
本申请实施例的方案可以应用于任何需要为用户推荐对象的网站,比如淘宝,aliexpress(全球速卖通),拍拍,京东,苏宁,亚马逊,ebay、1688等网站。
本申请实施例的对象可以是任何能够进行交易的对象都可以作为本申请实施例的对象,比如商品、服务等。
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
如图1所示,本申请实施例进行指标预测的方法包括:
步骤100、针对任意一个长度的滑动窗口,利用所述长度的滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,其中所述目标指标子集中包括获取的至少一个目标指标;
步骤101、根据确定的多个目标指标子集,确定所述长度的滑动窗口对应的预测模型集合;
步骤102、从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合;
步骤103、利用选择的至少一个预测模型集合预测所述对象的所述目标指标。
本申请实施例利用滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,从根据确定的多个目标指标子集,确定的预测模型集合中选择至少一个预测模型集合,并利用选择的至少一个预测模型集合预测所述对象的所述目标指标。由于借助滑动窗口切分目标指标,构造多个目标指标子集,并从多个目标指标子集上的预测模型中选择预测模型,从而提高了对对象的指标预测的准确率。
在实施中,本申请实施例可以对未来一段时长对象的指标进行预测,从而对库存调度、营销商品的选品和类目商品排序等提供比较大的帮助;也可以对之前一段时长对象的指标进行预测,从而可以判断实际指标和预测指标之间的差距,如果差距过大可以作为实际对象指标有异常的参考依据,比如对象的指标为销量,如果实际销量和预测销量之间差距比较大,有可能实际销量中有虚假销量,例如刷销量等。
其中,本申请实施例的目标指标可以是任何需要预测的指标,比如价格、销量、产品使用用户数、商场的人流量、软件的装机量、文章的转发量等。
可选的,本申请实施例会获取的目标时长内对象的目标指标。
这里的目标时长可以是预先设定的一段时长。一种可选的方式是根据需要预测的时长,确定所述目标时长。
比如需要预测之后一个月内的销量,可以设定目标时长为近一个月;需要预测之后两个月内的销量,可以设定目标时长为近两个月。
针对不同的应用场景,获取的对象的指标也不相同,以电商场景为例,对电商平台上的商品,按照商品的类目组织结构,分别提取不同类目下商品销售信息,包括商品的价格、销量、时间等相关历史数据信息(即获取的指标)。
由于不同时长得到的目标指标的数量不同,有可能出现获取的目标时长内对象的目标指标不充足的情况发生,比如目标时长为1个月,目标指标为销量,如果1个月的销量很少,则目标指标不充足,这样会影响预测的准确率。所以对于目标指标充足和不充足的情况具体的处理方式不同。
下面会针对两部分内容进行介绍,其中一部分是获取的目标时长内对象的目标指标充足的情况;另一部分是获取的目标时长内对象的目标指标不充足的情况。
第一部分:获取的目标时长内对象的目标指标充足。
若获取的目标时长内对象的目标指标大于阈值,则说明获取的目标时长内对象的目标指标的数量充足。
如果获取的目标时长内对象的目标指标大于阈值,则根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合;
针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;
每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集。
以电商场景为例,根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合时,可以将同一个类目下全部历史数据充足的商品归为一组,即历史数据充足商品集合,其中任意一个商品可以表示为一个第一目标指标集合。
假设目标指标为销量,则第一目标指标集合可以表示为:
<IDi,pi,x1,t1,x2,t2,...,xk,tk>;
其中,IDi是商品的平台编码;pi是商品的价格;j指代的是第一目标指标集合中的x1,t1和x2,t2…..,这些中的任意一个配对的数据指标对,由于总共有k组这样的配对数据指标,因此j的取值范围是1到k;xj表示该商品在tj时间段时的销量值,比如可以选择以天为时间单位。
为了简化商品销量与时间之间的关系,同时使得数据预测结果平稳可靠,对于历史数据充足的任意一个商品,基于滑动窗口构造不同时间长度的目标指标子集。
具体的,针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集。
每次滑动的长度可以根据经验、应用场景等进行设置,比如可以设置每次滑动的距离为滑动窗口长度的一半。
假设窗口长度为l,窗口起始位置为q,则包含时间和目标指标的目标指标子集可以表示为<IDi,pi,xq,tq,xq+1,tq+1,...,xq+l-1,tq+l-1>。
例如,一个历史数据充足的商品<IDi,pi,x1,t1,x2,t2,…,xk,tk>,若使用长度为L的滑动时间窗口,那么依次可以得到如下k-L+1个数据片段:
第一个目标指标子集<x1,t1,x2,t2,…,xL,tL>;
第二个目标指标子集<x2,t2,x3,t3…,xL+1,tL+1>;
依次类推。
最后一个目标指标子集<xk-L+1,tk-L+1,xk-L+2,tk-L+2,…,xk,tk>。
在每个目标指标子集内部,由于包含有时间t和对应时间下商品销量x,因此可以对每个目标指标子集构建一个预测模型。
在构建预测模型时,可以采用预测函数构建预测模型。只要能够基于一组输入指标数据回归预测出相应的输出目标指标数据的预测函数都可以作为本申请实施例构建预测模型所采用的预测函数,例如样条回归函数、多项式函数、非线性回归函数等。
下面列举几种:
1、采用ym=amt+bm构建预测模型,输入数据子集为{t1,y1,t2,y2,...,tl,yl}。其中,ym为线性回归预测函数的响应,即预测输出结果;am为线性回归函数的斜率参数;bm为线性回归函数的截距参数,即偏移量参数;t为时间。
am和bm的具体数值可以根据下列方式确定:
1、随机初始化a,b分别为a0,b0,模型参数更新学习率λ和迭代次数K,一般是人工预先设置的参数,通常可以设置为λ=0.01,K=103
2、for i=1:K,即一直对a和b迭代K次,这里输入是由t_i和y_i组成的数据对。
输出最终的aK和bK得到模型参数am和bm
这里采用的是随机梯度下降的思路,计算得到a_i,和b_i两个参数的更新方向。
其中,l为滑动窗口的长度;yj是第j个输入数据对(tj,yj)中的目标指标输出;tj是第j个输入数据对(tj,yj)中的输入时间。
由于一个长度的滑动窗口会得到M个目标指标子集,每个目标指标子集会对应一个预测模型,所以一个长度的滑动窗口会得到M个预测模型,组成预测模型集合。
按照不同长度的滑动窗口分别执行上述过程,就可以针对每个长度的滑动窗口得到一个预测模型集合。
具体的,确定每个预测模型集合的累积误差值;
根据确定的所述累积误差值,从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合。
比如可以选择出累积误差最小的预测模型集合。
可选的,根据下列公式确定预测模型集合的累积误差值:
其中,el为长度为l的滑动窗口对应的预测模型集合的累积误差值;tj为时长;am为第m个线性模型的斜率参数;bm为第m个线性模型的偏移量参数;M表示采用长度为l的滑动窗口得到的目标指标子集的数量。
需要说明的是,采用公式3确定累积误差值只是举例说明,任何能够确定预测模型集合的累积误差值的方式都适用本申请实施例。比如若按照一定比例将目标指标子集中的数据指标对随机进行划分为训练集合与测试集合,那么可以在训练集合中学习得到预测模型参数,然后将预测模型参数带入到测试集合中,计算预测模型在测试集合中的累积误差。此外,若某些特殊的时间点比较重要,那么可以采用加权的方式统计累积误差,从而进一步提高预测的准确率。
在选取了预测模型集合后,由于预测模型集合中包括多个预测模型,所以还需要进一步选取一个预测模型进行预测。
可选的,在针对每个长度的滑动窗口得到一个预测模型集合后,针对选择的所述预测模型集合中的任意一个预测模型,确定所述预测模型对应的时间;
根据确定的所有时间和需要预测的目标指标对应的时长,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
由于每个预测模型都是根据目标指标子集构建的,一个目标指标子集包括多个时间,在实施时可以根据目标指标子集包含的时间,确定预测模型对应的时间。
比如可以选取目标指标子集包含的时间中最近的时间;也可以选取目标指标子集包含的时间中最远的时间;也可以选取目标指标子集中间的一个时间(比如最近的时间和最远的时间的时长除以2)。将选取的时间作为预测模型对应的时间。
需要预测的目标指标对应的时长可以转换为时间,比如可以选取目标指标对应的时长中最近的时间;也可以选取目标指标对应的时长中最远的时间;也可以选取目标指标对应的时长中的一个时间(比如最近的时间和最远的时间的时长除以2,例如最近的时间是30号,最远的时间是1号,则选取的时间是15号)。
为了提高预测准确性,将需要预测的目标指标对应的时长转换为时间的选取方式可以与确定预测模型对应的时间的选取方式一致。
在选择预测模型集合中的预测模型时,可以选取所有时间中与需要预测的目标指标对应的时长最近的时间对应的预测模型。
比如对需要预测的时长转换后时3月15号,所有时间包括1月15号和2月15号,则选取2月15号对应的预测模型。
在选取了预测模型后就可以根据预测模型预测所述对象的所述目标指标。
第二部分:获取的目标时长内对象的目标指标不充足。
若获取的目标时长内对象的目标指标不大于阈值,则说明获取的目标时长内对象的目标指标的数量充足。
如果获取的目标时长内对象的目标指标不大于阈值,则根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象;
针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;
每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
以电商场景为例,如果获取的目标时长内对象的目标指标不大于阈值,则确定所有获取的目标时长的目标指标大于阈值的对象(即目标对象),并将确定的对象中同一类目下的对象分在一个集合中,这样针对每个集合分别执行后续步骤,每个集合都可以得到预测模型,后续可以利用得到的预测模型对同类目的不充足的对象进行预测。比如集合A的类目是衣服、集合B的类目是电子产品。需要对不充足的对象MP3进行预测,由于MP3属于电子产品,所以可以用集合B得到的预测模型对MP3进行预测。
根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合时,可以将同一个类目下全部历史数据充足的目标对象为一组,即历史数据充足商品集合。
假设目标指标为销量,筛选指标为价格,则统计同一类目下历史数据充足的对象在设定时长内的平均销量,如使用最近一个月的平均销量(比如可以选择以天为时间单位计算平均销量),从而可以得到该类目下包含筛选指标和目标指标的第二目标指标集合。第二目标指标集合可以表示为:
S={<p1,x1>,<p2,x2>,...,<pn,xn>};
其中,p1,...,pn为该类目下商品的全部价格取值,x1,...,xn表示对应价格点上的平均销量。
对第二目标指标集合S中的数据,可以按照筛选指标进行排序(比如按照由低到高的顺序排序),然后针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
每次滑动的长度可以根据经验、应用场景等进行设置,比如可以设置每次滑动的距离为滑动窗口长度的一半。
假设窗口长度为l,窗口起始位置为q,则包含排序参数和目标指标的目标指标子集可以表示为;
<pq,xq,pq+1,xq+1,......pq+1-l,xq+l-1>。
例如,一个第二目标指标集合为:<p1,x1,p2,x2,......pk,xk>若使用长度为L的滑动时间窗口,那么依次可以得到如下k-L+1个数据片段:
第一个目标指标子集<p1,x1,p2,x2,…,pL,xL>;
第二个目标指标子集<p2,x2,p3,x3,…,pL+1,xL+1>;
依次类推。
最后一个目标指标子集<pk-L+1,xk-L+1,pk-L+2,xk-L+2,…,pk,xk>。
在每个目标指标子集内部,由于包含有平均价格以及对应的销量,因此可以对每个目标指标子集构建一个预测模型。
在构建预测模型时,可以采用预测函数构建预测模型。只要能够基于一组输入指标数据回归预测出相应的输出目标指标数据的预测函数都可以作为本申请实施例构建预测模型所采用的预测函数,例如样条回归函数、多项式函数、非线性回归函数等。
下面列举几种:
1、采用ym=amp+bm构建预测模型,输入数据子集为{p1,y1,p2,y2,...,pl,yl}。其中,ym为线性回归预测函数的响应,即预测输出结果;am为线性回归函数的斜率参数;bm为线性回归函数的截距参数,即偏移量参数;p为平均价格。
am和bm的具体数值可以根据下列方式确定:
1、随机初始化a,b分别为a0,b0,模型参数更新学习率λ和迭代次数K,一般是人工预先设置的参数,通常可以设置为λ=0.01,K=103
2、for i=1:K,即一直对a和b迭代K次。
输出最终的aK和bK得到模型参数am和bm
这里采用的是随机梯度下降的思路,计算得到a_i,和b_i两个参数的更新方向。
其中,l为滑动窗口的长度;yj是第j个输入数据对(tj,yj)中的目标指标输出;tj是第j个输入数据对(tj,yj)中的输入时间。
由于一个长度的滑动窗口会得到M个目标指标子集,每个目标指标子集会对应一个预测模型,所以一个长度的滑动窗口会得到M个预测模型,组成预测模型集合。
按照不同长度的滑动窗口分别执行上述过程,就可以针对每个长度的滑动窗口得到一个预测模型集合。
具体的,确定每个预测模型集合的累积误差值;
根据确定的所述累积误差值,从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合。
比如可以选择出累积误差最小的预测模型集合。
可选的,根据下列公式确定预测模型集合的累积误差值:
其中,el为长度为l的滑动窗口对应的预测模型集合的累积误差值;pj为价格;am为第m个线性模型的斜率参数,bm为第m个线性模型的偏移量参数,M表示采用长度为l的滑动窗口得到的目标指标子集的数量。
需要说明的是,采用公式6确定累积误差值只是举例说明,任何能够确定预测模型集合的累积误差值的方式都适用本申请实施例。比如若按照一定比例将目标指标子集中的数据指标对随机进行划分为训练集合与测试集合,那么可以在训练集合中学习得到预测模型参数,然后将预测模型参数带入到测试集合中,计算预测模型在测试集合中的累积误差。此外,若某些特殊的时间点比较重要,那么可以采用加权的方式统计累积误差,从而进一步提高预测的准确率。
在选取了预测模型集合后,由于预测模型集合中包括多个预测模型,所以还需要进一步选取一个预测模型进行预测。
可选的,在针对每个长度的滑动窗口得到一个预测模型集合后,针对选择的所述预测模型集合中的任意一个预测模型,确定所述预测模型对应的筛选指标;
根据确定的所有筛选指标和需要预测的目标指标对应的筛选指标,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
由于每个预测模型都是根据目标指标子集构建的,一个目标指标子集包括多个筛选指标,在实施时可以确定包括需要预测的目标指标对应的筛选指标的目标指标子集,并采用确定的目标指标子集对应的预测模型预测所述对象的所述目标指标。
比如筛选指标为价格,目标指标子集A包括的筛选指标为1、2、3和4;目标指标子集B包括的筛选指标为3、4、5和6。如果需要预测的目标指标对应的价格为2,则可以采用目标指标子集A对应的预测模型进行预测。
如果有多个目标指标子集都包括需要预测的目标指标对应的筛选指标,则可以随机选择一个;还可以基于多个目标指标子集分别训练相应的预测模型,最后将所有预测模型的输出结果进行加权叠加,得到更加准确的结果。
最后针对同一类目下的所有对象,将利用第一部分预测得到的预测结果和利用第二部分预测得到的预测结果合并,就得到该类目下全部对象针对目标指标的预测结果。
本申请实施例借助滑动窗口切分目标指标,构造多个目标指标子集,将数据指标与目标指标之间极其复杂映射关系转换为在多个目标指标子集内相对简单的映射关系,并利用多个目标指标子集上的预测模型来逐段逼近整个数据集合上的最优预测模型,从而更好的提高了预测的准确率。
本申请实施例中搞设计的算法本身并不受具体实现语言的限制。在实际应用中,比如在电商平台下商品销量预估时,由于不同商品是按照类目进行组织划分的,所以如果采用分布式并行计算平台(如Hadoop、Spark等),则可以使得整个数据处理过程并行化,加快数据处理速度,从而达到最佳的实施效果。
如图2所示、本申请实施例进行指标预测的完整方法包括:
步骤200、获取同一个类目下目标时长内对象的目标指标。
步骤201、根据获取的目标指标,从同一个类目下确定目标指标充分的对象和目标指标不充分的对象。
针对目标指标充分的对象,执行后续步骤202~步骤208;
针对目标指标充分的对象,执行后续步骤209~步骤215。
步骤202、针对任意一个目标指标充分的对象,根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合。
步骤203、针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集。
步骤204、根据设置的不同长度的滑动窗口分别执行上述步骤203,从而得到多个预测模型集合。
步骤205、确定每个预测模型集合的累积误差值。
步骤206、根据确定的所述累积误差值,从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合。
步骤207、针对选择的所述预测模型集合中的任意一个预测模型,确定所述预测模型对应的时间;
步骤208、根据确定的所有时间和需要预测的目标指标对应的时长,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
步骤209、根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象。
步骤210、针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
步骤211、根据设置的不同长度的滑动窗口分别执行上述步骤210,从而得到多个预测模型集合。
步骤212、确定每个预测模型集合的累积误差值。
步骤213、根据确定的所述累积误差值,从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合。
步骤214、针对选择的所述预测模型集合中的任意一个预测模型,确定所述预测模型对应的筛选指标;
步骤215、根据确定的所有筛选指标和需要预测的目标指标对应的筛选指标,选择至少一个预测模型集合预测同类目下不充足的对象的所述目标指标。
基于同一发明构思,本申请实施例中还提供了一种进行指标预测的设备,由于该设备解决问题的原理与本申请实施例进行指标预测的设备的方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图3所示,本申请实施例进行指标预测的设备包括:
子集确定模块300,用于针对任意一个长度的滑动窗口,利用所述长度的滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,其中所述目标指标子集中包括获取的至少一个目标指标;
模型确定模块301,用于根据确定的多个目标指标子集,确定所述长度的滑动窗口对应的预测模型集合;
选择模块302,用于从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合;
预测模块303,用于利用选择的至少一个预测模型集合预测所述对象的所述目标指标。
本申请实施例利用滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,从根据确定的多个目标指标子集,确定的预测模型集合中选择至少一个预测模型集合,并利用选择的至少一个预测模型集合预测所述对象的所述目标指标。由于借助滑动窗口切分目标指标,构造多个目标指标子集,并从多个目标指标子集上的预测模型中选择预测模型,从而提高了对对象的指标预测的准确率。
在实施中,本申请实施例可以对未来一段时长对象的指标进行预测,从而对库存调度、营销商品的选品和类目商品排序等提供比较大的帮助;也可以对之前一段时长对象的指标进行预测,从而可以判断实际指标和预测指标之间的差距,如果差距过大可以作为实际对象指标有异常的参考依据,比如对象的指标为销量,如果实际销量和预测销量之间差距比较大,有可能实际销量中有虚假销量,例如刷销量等。
其中,本申请实施例的目标指标可以是任何需要预测的指标,比如价格、销量、产品使用用户数、商场的人流量、软件的装机量、文章的转发量等。
可选的,子集确定模块300还用于:
根据需要预测的时长,确定所述目标时长。
这里的目标时长可以是预先设定的一段时长。一种可选的方式是根据需要预测的时长,确定所述目标时长。
比如需要预测之后一个月内的销量,可以设定目标时长为近一个月;需要预测之后两个月内的销量,可以设定目标时长为近两个月。
针对不同的应用场景,获取的对象的指标也不相同,以电商场景为例,对电商平台上的商品,按照商品的类目组织结构,分别提取不同类目下商品销售信息,包括商品的价格、销量、时间等相关历史数据信息(即获取的指标)。
由于不同时长得到的目标指标的数量不同,有可能出现获取的目标时长内对象的目标指标不充足的情况发生,比如目标时长为1个月,目标指标为销量,如果1个月的销量很少,则目标指标不充足,这样会影响预测的准确率。所以对于目标指标充足和不充足的情况具体的处理方式不同。
下面会针对两部分内容进行介绍,其中一部分是获取的目标时长内对象的目标指标充足的情况;另一部分是获取的目标时长内对象的目标指标不充足的情况。
第一部分:获取的目标时长内对象的目标指标充足。
若获取的目标时长内对象的目标指标大于阈值,则说明获取的目标时长内对象的目标指标的数量充足。
如果获取的目标时长内对象的目标指标大于阈值,则子集确定模块300根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合;
针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;
每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集。
在每个目标指标子集内部,由于包含有时间t和对应时间下商品销量x,因此可以对每个目标指标子集构建一个预测模型。
可选的,模型确定模块301在构件预测模型时,可以采用预测函数构建预测模型。只要能够基于一组输入指标数据回归预测出相应的输出目标指标数据的预测函数都可以作为本申请实施例构建预测模型所采用的预测函数,例如样条回归函数、多项式函数、非线性回归函数等。
由于一个长度的滑动窗口会得到M个目标指标子集,每个目标指标子集会对应一个预测模型,所以一个长度的滑动窗口会得到M个预测模型,组成预测模型集合。
按照不同长度的滑动窗口分别执行上述过程,就可以针对每个长度的滑动窗口得到一个预测模型集合。
具体的,所述选择模块302具体用于:
确定每个预测模型集合的累积误差值;
根据确定的所述累积误差值,从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合。
在选取了预测模型集合后,由于预测模型集合中包括多个预测模型,所以预测模块303还需要进一步选取一个预测模型进行预测。
可选的,在针对每个长度的滑动窗口得到一个预测模型集合后,针对选择的所述预测模型集合中的任意一个预测模型,预测模块303确定所述预测模型对应的时间;
根据确定的所有时间和需要预测的目标指标对应的时长,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
由于每个预测模型都是根据目标指标子集构建的,一个目标指标子集包括多个时间,在实施时可以根据目标指标子集包含的时间,确定预测模型对应的时间。
比如可以选取目标指标子集包含的时间中最近的时间;也可以选取目标指标子集包含的时间中最远的时间;也可以选取目标指标子集中间的一个时间(比如最近的时间和最远的时间的时长除以2)。将选取的时间作为预测模型对应的时间。
需要预测的目标指标对应的时长可以转换为时间,比如可以选取目标指标对应的时长中最近的时间;也可以选取目标指标对应的时长中最远的时间;也可以选取目标指标对应的时长中的一个时间(比如最近的时间和最远的时间的时长除以2,例如最近的时间是30号,最远的时间是1号,则选取的时间是15号)。
为了提高预测准确性,将需要预测的目标指标对应的时长转换为时间的选取方式可以与确定预测模型对应的时间的选取方式一致。
在选择预测模型集合中的预测模型时,可以选取所有时间中与需要预测的目标指标对应的时长最近的时间对应的预测模型。
比如对需要预测的时长转换后时3月15号,所有时间包括1月15号和2月15号,则选取2月15号对应的预测模型。
在选取了预测模型后就可以根据预测模型预测所述对象的所述目标指标。
第二部分:获取的目标时长内对象的目标指标不充足。
若获取的目标时长内对象的目标指标不大于阈值,则说明获取的目标时长内对象的目标指标的数量充足。
如果获取的目标时长内对象的目标指标不大于阈值,则子集确定模块300根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象;
针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;
每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
以电商场景为例,如果获取的目标时长内对象的目标指标不大于阈值,则确定所有获取的目标时长的目标指标大于阈值的对象(即目标对象),并将确定的对象中同一类目下的对象分在一个集合中,这样针对每个集合分别执行后续步骤,每个集合都可以得到预测模型,后续可以利用得到的预测模型对同类目的不充足的对象进行预测。比如集合A的类目是衣服、集合B的类目是电子产品。需要对不充足的对象MP3进行预测,由于MP3属于电子产品,所以可以用集合B得到的预测模型对MP3进行预测。
在每个目标指标子集内部,由于包含有平均价格以及对应的销量,因此可以对每个目标指标子集构建一个预测模型。
模型确定模块301在构件预测模型时,可以采用预测函数构建预测模型。只要能够基于一组输入指标数据回归预测出相应的输出目标指标数据的预测函数都可以作为本申请实施例构建预测模型所采用的预测函数,例如样条回归函数、多项式函数、非线性回归函数等。
由于一个长度的滑动窗口会得到M个目标指标子集,每个目标指标子集会对应一个预测模型,所以一个长度的滑动窗口会得到M个预测模型,组成预测模型集合。
按照不同长度的滑动窗口分别执行上述过程,就可以针对每个长度的滑动窗口得到一个预测模型集合。
具体的,所述选择模块302确定每个预测模型集合的累积误差值;
根据确定的所述累积误差值,从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合。
在选取了预测模型集合后,由于预测模型集合中包括多个预测模型,所以预测模块303还需要进一步选取一个预测模型进行预测。
可选的,在针对每个长度的滑动窗口得到一个预测模型集合后,针对选择的所述预测模型集合中的任意一个预测模型,预测模块303确定所述预测模型对应的筛选指标;
根据确定的所有筛选指标和需要预测的目标指标对应的筛选指标,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
由于每个预测模型都是根据目标指标子集构建的,一个目标指标子集包括多个筛选指标,在实施时可以确定包括需要预测的目标指标对应的筛选指标的目标指标子集,并采用确定的目标指标子集对应的预测模型预测所述对象的所述目标指标。
比如筛选指标为价格,目标指标子集A包括的筛选指标为1、2、3和4;目标指标子集B包括的筛选指标为3、4、5和6。如果需要预测的目标指标对应的价格为2,则可以采用目标指标子集A对应的预测模型进行预测。
如果有多个目标指标子集都包括需要预测的目标指标对应的筛选指标,则可以随机选择一个;还可以基于多个目标指标子集分别训练相应的预测模型,最后将所有预测模型的输出结果进行加权叠加,得到更加准确的结果。
最后针对同一类目下的所有对象,将利用第一部分预测得到的预测结果和利用第二部分预测得到的预测结果合并,就得到该类目下全部对象针对目标指标的预测结果。
如图4所示,本申请实施例另一种进行指标预测的方法包括:
步骤400、根据获取的目标时长内对象的目标指标,将对象分成多个对象集合;
步骤401、根据多个目标指标子集,确定所述对象集合对应的预测模型集合,其中所述目标指标子集中包括获取的目标时长内对象集合中的对象的目标指标,所述预测模型集合中的预测模块对应不同长度的滑动窗口;
步骤402、根据所述对象集合对应的预测模型集合,预测所述对象的所述目标指标。
图4的实施例中涉及的词语的含义与图1的实施例中相同名称的词语的含义相同,在此不再赘述。比如对象、目标指标、滑动窗口、预测模块等。
可选的,所述根据获取的目标时长内对象的目标指标,将对象分成多个对象集合,包括:
将获取的目标时长内对象的目标指标大于阈值的对象划分到一个集合中;以及将获取的目标时长内对象的目标指标不大于阈值的对象划分到另一个集合中。
可选的,根据下列方式确定多个目标指标子集:
若获取的目标时长内对象的目标指标大于阈值,则根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合;针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集;或
若获取的目标时长内对象的目标指标不大于阈值,则根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象;针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
其中,图4的实施例中确定多个目标指标子集的方式与图1的实施例中确定多个目标指标子集的方式相同,在此不再赘述。
基于同一发明构思,本申请实施例中还提供了一种进行指标预测的设备,由于该设备解决问题的原理与本申请实施例进行指标预测的设备的方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图5所示,本申请实施例另一种进行指标预测的设备包括:
划分模块500,用于根据获取的目标时长内对象的目标指标,将对象分成多个对象集合;
集合确定模块501,用于根据多个目标指标子集,确定所述对象集合对应的预测模型集合,其中所述目标指标子集中包括获取的目标时长内对象集合中的对象的目标指标,所述预测模型集合中的预测模块对应不同长度的滑动窗口;
处理模块502,用于根据所述对象集合对应的预测模型集合,预测所述对象的所述目标指标。
可选的,所述划分模块500具体用于:
将获取的目标时长内对象的目标指标大于阈值的对象划分到一个集合中;以及将获取的目标时长内对象的目标指标不大于阈值的对象划分到另一个集合中。
可选的,所述集合确定模块501还用于,根据下列方式确定多个目标指标子集:
若获取的目标时长内对象的目标指标大于阈值,则根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合;针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集;或
若获取的目标时长内对象的目标指标不大于阈值,则根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象;针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。
相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或设备使用,或结合指令执行系统、装置或设备使用。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (20)

1.一种进行指标预测的方法,其特征在于,该方法包括:
针对任意一个长度的滑动窗口,利用所述长度的滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,其中所述目标指标子集中包括获取的至少一个目标指标;
根据确定的多个目标指标子集,确定所述长度的滑动窗口对应的预测模型集合;
从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合;
利用选择的至少一个预测模型集合预测所述对象的所述目标指标。
2.如权利要求1所述的方法,其特征在于,所述根据目标时长内对象的目标指标确定多个目标指标子集之前,还包括:
根据需要预测的时长,确定所述目标时长。
3.如权利要求1所述的方法,其特征在于,所述利用所述长度的滑动窗口,根据目标时长内对象的目标指标确定多个目标指标子集,包括:
若获取的目标时长内对象的目标指标大于阈值,则根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合;
针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;
每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集。
4.如权利要求3所述的方法,其特征在于,所述利用选择的至少一个预测模型集合预测所述对象的所述目标指标,包括:
针对选择的所述预测模型集合中的任意一个预测模型,确定所述预测模型对应的时间;
根据确定的所有时间和需要预测的目标指标对应的时长,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
5.如权利要求1所述的方法,其特征在于,所述利用所述长度的滑动窗口,根据目标时长内对象的目标指标确定多个目标指标子集,包括:
若获取的目标时长内对象的目标指标不大于阈值,则根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象;
针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;
每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
6.如权利要求5所述的方法,其特征在于,所述利用选择的至少一个预测模型集合预测所述对象的所述目标指标,包括:
针对选择的所述预测模型集合中的任意一个预测模型,确定所述预测模型对应的筛选指标;
根据确定的所有筛选指标和需要预测的目标指标对应的筛选指标,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
7.如权利要求1~6任一所述的方法,其特征在于,所述从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合,包括:
确定每个预测模型集合的累积误差值;
根据确定的所述累积误差值,从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合。
8.一种进行指标预测的设备,其特征在于,该设备包括:
子集确定模块,用于针对任意一个长度的滑动窗口,利用所述长度的滑动窗口,根据获取的目标时长内对象的目标指标确定多个目标指标子集,其中所述目标指标子集中包括获取的至少一个目标指标;
模型确定模块,用于根据确定的多个目标指标子集,确定所述长度的滑动窗口对应的预测模型集合;
选择模块,用于从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合;
预测模块,用于利用选择的至少一个预测模型集合预测所述对象的所述目标指标。
9.如权利要求8所述的设备,其特征在于,所述子集确定模块还用于:
根据需要预测的时长,确定所述目标时长。
10.如权利要求8所述的设备,其特征在于,所述子集确定模块具体用于:
若获取的目标时长内对象的目标指标大于阈值,则根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合;
针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;
每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集。
11.如权利要求10所述的设备,其特征在于,所述选择模块具体用于:
针对选择的所述预测模型集合中的任意一个预测模型,确定所述预测模型对应的时间;
根据确定的所有时间和需要预测的目标指标对应的时长,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
12.如权利要求8所述的设备,其特征在于,所述子集确定模块具体用于:
若获取的目标时长内对象的目标指标不大于阈值,则根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象;
针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;
每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
13.如权利要求12所述的设备,其特征在于,所述子集确定模块具体用于:
针对选择的所述预测模型集合中的任意一个预测模型,确定所述预测模型对应的筛选指标;
根据确定的所有筛选指标和需要预测的目标指标对应的筛选指标,从所述预测模型集合中选择预测模型对所述目标指标进行预测。
14.如权利要求8~13任一所述的设备,其特征在于,所述选择模块具体用于:
确定每个预测模型集合的累积误差值;
根据确定的所述累积误差值,从所有长度的滑动窗口对应的预测模型集合中选择至少一个预测模型集合。
15.一种进行指标预测的方法,其特征在于,该方法包括:
根据获取的目标时长内对象的目标指标,将对象分成多个对象集合;
根据多个目标指标子集,确定所述对象集合对应的预测模型集合,其中所述目标指标子集中包括获取的目标时长内对象集合中的对象的目标指标,所述预测模型集合中的预测模块对应不同长度的滑动窗口;
根据所述对象集合对应的预测模型集合,预测所述对象的所述目标指标。
16.如权利要求15所述的方法,其特征在于,所述根据获取的目标时长内对象的目标指标,将对象分成多个对象集合,包括:
将获取的目标时长内对象的目标指标大于阈值的对象划分到一个集合中;以及将获取的目标时长内对象的目标指标不大于阈值的对象划分到另一个集合中。
17.如权利要求16所述的方法,其特征在于,根据下列方式确定多个目标指标子集:
若获取的目标时长内对象的目标指标大于阈值,则根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合;针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集;或
若获取的目标时长内对象的目标指标不大于阈值,则根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象;针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
18.一种进行指标预测的设备,其特征在于,该设备包括:
划分模块,用于根据获取的目标时长内对象的目标指标,将对象分成多个对象集合;
集合确定模块,用于根据多个目标指标子集,确定所述对象集合对应的预测模型集合,其中所述目标指标子集中包括获取的目标时长内对象集合中的对象的目标指标,所述预测模型集合中的预测模块对应不同长度的滑动窗口;
处理模块,用于根据所述对象集合对应的预测模型集合,预测所述对象的所述目标指标。
19.如权利要求18所述的设备,其特征在于,所述划分模块具体用于:
将获取的目标时长内对象的目标指标大于阈值的对象划分到一个集合中;以及将获取的目标时长内对象的目标指标不大于阈值的对象划分到另一个集合中。
20.如权利要求19所述的设备,其特征在于,所述集合确定模块还用于,根据下列方式确定多个目标指标子集:
若获取的目标时长内对象的目标指标大于阈值,则根据获取的所述目标时长内所述对象的目标指标,确定包含时间和目标指标的第一目标指标集合;针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第一目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含时间和目标指标的目标指标子集;或
若获取的目标时长内对象的目标指标不大于阈值,则根据获取的所述目标时长内目标对象的目标指标,确定包含筛选指标和目标指标的第二目标指标集合,其中所述目标对象为获取的所述目标时长内目标指标大于阈值对应的对象;针对任意一个长度的滑动窗口,根据设定的滑动距离,将所述长度的滑动窗口在所述第二目标指标集合上滑动;每滑动一次将所述长度的滑动窗口内的目标指标组成一个包含排序参数和目标指标的目标指标子集。
CN201611070657.0A 2016-11-25 2016-11-25 一种进行指标预测的方法和设备 Pending CN107016564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611070657.0A CN107016564A (zh) 2016-11-25 2016-11-25 一种进行指标预测的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611070657.0A CN107016564A (zh) 2016-11-25 2016-11-25 一种进行指标预测的方法和设备

Publications (1)

Publication Number Publication Date
CN107016564A true CN107016564A (zh) 2017-08-04

Family

ID=59438950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611070657.0A Pending CN107016564A (zh) 2016-11-25 2016-11-25 一种进行指标预测的方法和设备

Country Status (1)

Country Link
CN (1) CN107016564A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108989889A (zh) * 2018-08-09 2018-12-11 北京奇艺世纪科技有限公司 一种视频播放量预测方法、装置及电子设备
CN117455632A (zh) * 2023-12-25 2024-01-26 厦门蝉羽网络科技有限公司 一种基于大数据的电商选品分析管理平台

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1173562A (ja) * 1997-08-29 1999-03-16 Sanyo Electric Co Ltd 販売予測装置
US20130282433A1 (en) * 2012-04-20 2013-10-24 Bruce C. Richardson Methods and apparatus to manage marketing forecasting activity
CN104217355A (zh) * 2014-09-11 2014-12-17 北京京东尚科信息技术有限公司 预测促销商品销量的方法和装置
CN105427118A (zh) * 2015-07-23 2016-03-23 浙江大学 一种应用于电子商务的商品销量预测算法
CN105956699A (zh) * 2016-04-29 2016-09-21 连云港天马网络发展有限公司 基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1173562A (ja) * 1997-08-29 1999-03-16 Sanyo Electric Co Ltd 販売予測装置
US20130282433A1 (en) * 2012-04-20 2013-10-24 Bruce C. Richardson Methods and apparatus to manage marketing forecasting activity
CN104217355A (zh) * 2014-09-11 2014-12-17 北京京东尚科信息技术有限公司 预测促销商品销量的方法和装置
CN105427118A (zh) * 2015-07-23 2016-03-23 浙江大学 一种应用于电子商务的商品销量预测算法
CN105956699A (zh) * 2016-04-29 2016-09-21 连云港天马网络发展有限公司 基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵颖: "基于回归分析的我国汽车销量预测模型研究", 《中国优秀硕士学位论文全文数据库(电子期刊)(基础科学辑)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108989889A (zh) * 2018-08-09 2018-12-11 北京奇艺世纪科技有限公司 一种视频播放量预测方法、装置及电子设备
CN117455632A (zh) * 2023-12-25 2024-01-26 厦门蝉羽网络科技有限公司 一种基于大数据的电商选品分析管理平台
CN117455632B (zh) * 2023-12-25 2024-03-15 厦门蝉羽网络科技有限公司 一种基于大数据的电商选品分析管理平台

Similar Documents

Publication Publication Date Title
CN109784806B (zh) 供应链控制方法、系统以及存储介质
CN110070117B (zh) 一种数据处理方法及装置
Zhu et al. Hesitant analytic hierarchy process
CN104915735B (zh) 企业运营分析预警系统的预警分析方法
CN104134159B (zh) 一种基于随机模型预测信息最大化传播范围的方法
CN109587713A (zh) 一种基于arima模型的网络指标预测方法、装置及存储介质
KR101919076B1 (ko) 시계열 데이터 예측 시스템
Llorca et al. Using the latent class approach to cluster firms in benchmarking: An application to the US electricity transmission industry
CN106296669A (zh) 一种图像质量评价方法和装置
CN107423859A (zh) 一种组合模型建模方法及系统
CN111435463A (zh) 数据处理方法及相关设备、系统
CN109657962B (zh) 一种品牌的声量资产的评估方法及系统
CN103559303A (zh) 一种对数据挖掘算法的评估与选择方法
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
Pınarbaşı et al. Variability modelling and balancing of stochastic assembly lines
CN112036483B (zh) 基于AutoML的对象预测分类方法、装置、计算机设备及存储介质
CN110458668A (zh) 确定产品推荐算法的方法及装置
CN104866922A (zh) 一种用户离网的预测方法及装置
CN116882708A (zh) 基于数字孪生的钢铁工艺流程管控方法、装置及相关设备
CN107016564A (zh) 一种进行指标预测的方法和设备
San Cristóbal et al. A residual grey prediction model for predicting s-curves in projects
CN109636184B (zh) 一种品牌的账号资产的评估方法及系统
JP2013033450A (ja) 製造工期予測装置、製造工期予測方法、及びコンピュータプログラム
Almomani et al. Selecting a good stochastic system for the large number of alternatives
JP6468653B2 (ja) 予測モデル構築装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170804

RJ01 Rejection of invention patent application after publication