CN111695791A - 一种业务指标预测方法及装置 - Google Patents

一种业务指标预测方法及装置 Download PDF

Info

Publication number
CN111695791A
CN111695791A CN202010472750.4A CN202010472750A CN111695791A CN 111695791 A CN111695791 A CN 111695791A CN 202010472750 A CN202010472750 A CN 202010472750A CN 111695791 A CN111695791 A CN 111695791A
Authority
CN
China
Prior art keywords
time
service index
value
historical
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010472750.4A
Other languages
English (en)
Inventor
聂晓楠
施雯洁
钱波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010472750.4A priority Critical patent/CN111695791A/zh
Publication of CN111695791A publication Critical patent/CN111695791A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Abstract

本申请涉及计算机技术领域,尤其涉及一种业务指标预测方法及装置,获取历史业务指标序列,历史业务指标序列表征按照连续单位时间顺序排列的业务指标,并单位时间为各业务指标呈波动变化时对应的设定波动时间,设定波动时间对应的各业务指标按照时长时间呈周期性和趋势性变化,所述时长时间大于所述设定波动时间;确定目标时刻与历史参考时刻的跨度差值,其中,所述历史参考时刻是从所述历史业务指标序列对应的时间中确定的;基于三次指数平滑模型,根据所述跨度差值、所述历史业务指标序列和训练确定的各平滑参数,预测所述目标时刻的业务指标,这样,基于三次指数平滑模型,可以充分挖掘数据时间序列的周期性和趋势性,提高预测准确性。

Description

一种业务指标预测方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种业务指标预测方法及装置。
背景技术
目前,在某超市、商场等的到家业务场景,每小时的交易量很大,且呈现出增长趋势,宕机会影响交易,导致一定交易额的损失,而对于业务管理评估等需求,需要能够准确地获知宕机受影响的交易额,即如何有效准确地预测出宕机受影响的交易额是非常必要的。
相关技术中,交易额预测主要采用的方法为:
Figure BDA0002514860400000011
其中xi表示第i个时间单位的销售额,N为总计时间单位,并通常是以天粒度为时间单位,但是这种方式,直接采用平均值来预估,考虑的信息比较简单,尤其是针对到家业务场景通常一天内工作时段交易额周期性变化,无法综合周期性等信息,预测结果准确性不太高。
发明内容
本申请实施例提供一种业务指标预测方法及装置,以提高业务指标预测的准确性。
本申请实施例提供的具体技术方案如下:
本申请一个实施例提供了一种业务指标预测方法,包括:
获取历史业务指标序列,其中,所述历史业务指标序列表征按照连续单位时间顺序排列的业务指标,并所述单位时间为各业务指标呈波动变化时对应的设定波动时间,所述设定波动时间对应的各业务指标按照时长时间呈周期性和趋势性变化,所述时长时间大于所述设定波动时间;
确定目标时刻与历史参考时刻的跨度差值,其中,所述历史参考时刻是从所述历史业务指标序列对应的时间中确定的;
基于三次指数平滑模型,根据所述跨度差值、所述历史业务指标序列和训练确定的各平滑参数,预测所述目标时刻的业务指标。
本申请另一个实施例提供了一种业务指标预测装置,包括:
获取模块,用于获取历史业务指标序列,其中,所述历史业务指标序列表征按照连续单位时间顺序排列的业务指标,并所述单位时间为各业务指标呈波动变化时对应的设定波动时间,所述设定波动时间对应的各业务指标按照时长时间呈周期性和趋势性变化,所述时长时间大于所述设定波动时间;
确定模块,用于确定目标时刻与历史参考时刻的跨度差值,其中,所述历史参考时刻是从所述历史业务指标序列对应的时间中确定的;
预测模块,用于基于三次指数平滑模型,根据所述跨度差值、所述历史业务指标序列和训练确定的各平滑参数,预测所述目标时刻的业务指标。
本申请另一个实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一种业务指标预测方法的步骤。
本申请另一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种业务指标预测方法的步骤。
本申请实施例中,获取历史业务指标序列,并确定目标时刻与历史参考时刻的跨度差值,进而基于三次指数平滑模型,根据跨度差值、历史业务指标序列和训练确定的各平滑参数,预测目标时刻的业务指标,这样,针对具有周期性和趋势性的业务指标数据,采用三次指数平滑模型进行预测,可以描述数据序列的周期性和趋势性,并且采用设定波动时间为时间单位,相较于采用天粒度预测,更加符合实际应用场景,可以描述设定波动时间的各个业务指标的周期性和趋势性,提高预测准确性。
附图说明
图1为本申请实施例中到家业务的每小时销售额和日均销售额对比示意图;
图2为本申请实施例中业务指标预测方法的应用架构示意图;
图3为本申请实施例中业务指标预测方法流程图;
图4为本申请实施例中三次指数平滑模型训练方法流程图;
图5为本申请实施例中一种业务指标预测方法效果示意图;
图6为本申请实施例中另一种业务指标预测方法效果示意图;
图7为本申请实施例中业务指标预测装置结构示意图;
图8为本申请实施例中电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于对本发明实施例的理解,下面先对几个概念进行简单介绍:
业务指标:本申请实施例中可以表征与业务关联的指标数据,例如,销售额、订单数、页面访问量(Page View,pv)、独立访客(Unique Visitor,uv)等,并不进行限制,本申请实施例中主要是实现基于历史业务指标数据,对未来的业务指标数据进行预测。
周期性:本申请实施例中也可以称为季节性,表示业务指标按照时间排列后具有的周期特性,描述的是数据的周期性波动,比如以年或者周为周期,例如,到家业务的销售额,工作时段内每小时的销售额具有明显的周期性,通常以天或周为周期。
趋势性:表示事物发展的动向,趋势描述的是时间序列的整体走势,比如总体上升或者总体下降,例如,本申请实施例中在工作时段内每小时的销售额具有明显波动性,销售额时间序列总体上呈增长趋势。
三次指数平滑加性模型(Holt Winters add):是三次指数平滑模型的一种,三次指数平滑算法可以对同时含有趋势性和季节性的时间序列进行预测,该算法是基于一次指数平滑和二次指数平滑算法的。
针对到家业务场景,每小时交易量很大,且呈现出增长趋势,宕机会影响交易,造成一定的损失,合理预测工作时段内因宕机受影响销售额是非常有必要的,相关技术中,受影响交易额的预测方法主要为:
Figure BDA0002514860400000041
其中,xi表示第i个时间单位的销售额,N为总计时间单位,并通常是以天粒度为时间单位,但是这种方式,仅采用平均值来预估,考虑的信息比较简单,粒度不够,尤其是针对到家业务场景通常一天内工作时段交易额周期性变化,无法综合周期性等信息,预测结果准确性不太高。
因此,针对上述问题并综合考虑到家业务的销售额数据的特点,例如,参阅图1所示,为本申请实施例中到家业务的每小时销售额和日均销售额对比示意图,图1中波动较小的表示日均销售额,波动较大的表示每小时销售额,可知,在工作时段内,每小时的销售额具有明显的周期性和波动性,有高峰期和低峰期,相关技术中用天粒度的均值评估并不合理,预测结果不准确,因此,本申请实施例中,在预测时,以设定波动时间为时间单位,较佳的为最小波动时间,例如到家业务的销售额以小时为时间单位,考虑业务指标的周期性和趋势性,获取历史业务指标序列,并确定目标时刻与历史参考时刻的跨度差值,基于三次指数平滑模型,根据跨度差值、历史业务指标序列和训练确定的各平滑参数,预测目标时刻的业务指标,这样,采用三次指数平滑模型,可以预测出业务指标的趋势性和周期性,并且计算粒度更小,解决了现有策略无法描述一天内工作时段销售额的周期性变化的问题,提高了预测的准确性。
参阅图2所示,为本申请实施例中业务指标预测方法的应用架构示意图,包括终端100、服务器200。
终端100可以是智能手机、平板电脑、便携式个人计算机等任何智能设备,终端100上可以安装有各种应用程序,例如,用户可以通过终端100中某超市应用程序(Application,APP)下单来购买所需商品,进而在相应的服务器200端可以记录每小时的订单和销售额等信息。
服务器200能够为终端100提供各种网络服务,对于不同的应用程序,服务器200可以认为是相应的后台服务器。
其中,服务器200可以是一台服务器、若干台服务器组成的服务器集群或云计算中心。
终端100与服务器200之间可以通过互联网相连,实现相互之间的通信。可选地,上述的互联网使用标准通信技术、协议,或者两者结合。互联网通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan AreaNetwork,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure SocketLayer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(VirtualPrivate Network,VPN)、网际协议安全(Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
需要说明的是,本申请实施例中的业务指标预测方法可以由终端100侧执行,也可以由服务器200侧执行,对此并不进行限制,例如,终端100可以从服务器200请求获取历史业务指标序列,并从服务器200请求获取三次指数平滑模型,进而终端100可以基于三次指数平滑模型和历史业务指标序列,对目标时刻的业务指标进行预测,确定目标时刻的业务指标。又例如,服务器200基于三次指数平滑模型和历史业务指标序列,进行预测,确定目标时刻的业务指标。
值得说明的是,本申请实施例中的应用架构图是为了更加清楚地说明本申请实施例中的技术方案,并不构成对本申请实施例提供的技术方案的限制,也并不仅限于销售额业务指标,对于其它的应用架构和业务应用,本申请实施例提供的技术方案对于类似的问题,同样适用,例如,还可以应用于各种零售指标预估场景,例如订单数、pv、uv等,本申请各个实施例中,以业务指标预测方法应用于图2所示的应用架构为例进行示意性说明。
基于上述实施例,参阅图3所示,为本申请实施例中业务指标预测方法流程图,该方法包括:
步骤300:获取历史业务指标序列。
其中,历史业务指标序列表征按照连续单位时间顺序排列的业务指标,并单位时间为各业务指标呈波动变化时对应的设定波动时间,设定波动时间对应的各业务指标按照时长时间呈周期性和趋势性变化,时长时间大于设定波动时间。
本申请实施例中,主要是针对具有周期性和趋势性的数据序列,可以从中挖掘历史业务指标序列的周期性和趋势性,从而实现预测未来目标时刻的业务指标,较佳的,获取的历史业务指标序列至少满足一个周期,当然若历史业务指标序列不足一个周期,也可以基于本申请实施例中的业务指标预测方法进行预测,这时可以认为目标时刻上一周期对应的时刻的周期平滑值为0,或者也可以为其它预设初始值,具体本申请实施例中并不进行限制。
其中,设定波动时间可以根据实际应用场景进行确定,例如,针对到家业务的销售额,设定波动时间可以设置为1小时,并且销售额通常按照天和周呈周期性和趋势性变化,这样,本申请实施例中考虑的粒度更细,更加符合实际应用场景,可以挖掘设定波动时间对应的各业务指标之间的关系,提高准确性。
例如,某商场外送APP的服务器出现了宕机,这时用户无法在APP中下单,影响了这段时间的销售额,若需要对宕机这段时间的销售额进行预测,可以获取宕机发生前一段时间的历史销售额,例如,一天工作时间段为12个小时,从早上八点到晚上八点,下午3点时出现了宕机,并以一小时为设定波动时间,则可以获取3点之前的历史销售额,如从前两周开始每天早八点到晚八点至今天两点之间的销售额,基于这些历史销售额,来预测3点或宕机修复好之前的各目标时刻的销售额。
进一步地,为保证历史业务指标序列中各业务指标的可靠性,也提高后续预测的准确性,还可以对历史业务指标序列进行预处理,具体本申请实施例中提供了一种可能的实施方式,获取历史业务指标序列之后,还包括:筛选出历史业务指标序列中的变化率超过阈值的业务指标;针对筛选出的各业务指标,分别根据对应前后两个时刻的业务指标的平均值,对筛选出的各业务指标进行修改。
也就是说,本申请实施例中,考虑到历史业务指标序列中可能会存在由于系统故障或其它原因导致的不可信数据,如某时刻的业务指标突然降低了很多,变化率突然很高,可以认为是不正常不可信的数据,则可以采用对应前后两个时刻的业务指标的平均值,来该这类不可信数据进行填补和修改。
例如,八点的销售额为500元,十点的销售额为700元,而九点的销售额为10元,则可以认为九点的销售额为不可信数据,可以采用八点和十点的销售额的平均值,即(500+700)/2=600元,作为九点的销售额。
步骤310:确定目标时刻与历史参考时刻的跨度差值,其中,历史参考时刻是从历史业务指标序列对应的时间中确定的。
其中,历史参考时刻可以根据实际情况进行选择,本申请实施例中并不进行限制,例如,历史参考时刻为上午10点,目标时刻为上午12点,并且针对各历史业务指标序列分别给定一个编号,一般是[0,N)或[1,N],N表示所有业务指标数据的数量,各历史业务指标的编号按照时间前后顺序依次增加,则目标时刻上午12点与历史参考时刻上午10点的跨度差值为2。
步骤320:基于三次指数平滑模型,根据跨度差值、历史业务指标序列和训练确定的各平滑参数,预测目标时刻的业务指标。
本申请实施例中,采用三次指数平滑模型对目标时刻的业务指标进行预测,相比于一次指数平滑和二次指数平滑,三次指数平滑能够从时间序列数据中获取到趋势和周期性信息,进而可以利用这些信息对未来值进行预测。
其中,三次指数平滑模型包括预测公式,预测公式表征目标时刻的业务指标,与历史参考时刻的水平平滑值、历史参考时刻的趋势平滑值以及目标时刻上一周期对应的时刻的周期平滑值之间的关联关系。
例如,预测公式为:xi+h=si+hti+pi-k+(hmodk)
其中,h为跨度差值,k为周期,mod表示取余,i表示计数的量,表示第几个数据(即各业务指标的编号,本申请实施例中可以预先给各业务指标按照顺序进行编号),xi+h为目标时刻的业务指标,si为第i时刻的水平平滑值,即历史参考时刻的水平平滑值,ti为第i时刻的趋势平滑值,pi-k+(hmodk)为目标时刻上一周期对应的时刻的周期平滑值,(hmodk)保证了用于预测的周期性指数的估计值是来自于上一季(即上一周期)的同一时期。
下面对si、ti、pi的计算公式进行说明,si水平平滑值是基于一次指数平滑公式确定的,ti趋势平滑值是基于二次指数平滑公式确定的,pi周期平滑值是基于三次指数平滑公式确定的。
1)一次指数平滑公式:第i时刻水平平滑值表示基于第一平滑参数,周期性调整后的第i时刻业务指标真实值和非周期性调整后的第i-1时刻业务指标水平平滑值之间的加权平均。
例如,一次指数平滑公式:si=α(xi-pi-k)+(1-α)(si-1+ti-1)。
其中,一次指数平滑公式表示是水平方程,α为第一平滑参数,si表示周期性调整后的第i个业务指标真实值(xi-pi-k)与非周期性调整的第i-1个业务指标的估计值(si-1+ti-1)之间的加权平均。可知,一次指数平滑公式仅表示数据之间的差距,仅用该方程评估只能得到一条水平线,无法表示趋势性和周期性。
2)二次指数平滑公式:第i时刻趋势平滑值表示基于第二平滑参数,第i时刻水平平滑值与第i-1时刻水平平滑值的差值,和第i-1时刻趋势平滑值的加权平均。
例如,二次指数平滑公式为:ti=β(si-si-1)+(1-β)ti-1
其中,二次指数平滑公式表示趋势方程,β为第二平滑参数,ti表示该业务指标时间序列在第i时刻的趋势(即斜率)的估计,当前的趋势ti是前一个趋势ti-1和水平平滑值差值(si-si-1)(当下时刻的趋势估计)的加权平均。可知,二次指数平滑公式表示数据增长或下降的趋势,用一次指数平滑公式和二次指数平滑公式仅能得到一条波动上升或波动下降的曲线,无法获得其在一个周期内的季节性变化。
3)三次指数平滑公式:第i时刻周期平滑值表示基于第三平滑参数,第i时刻周期性指数和上一周期对应时刻周期平滑值之间的加权平均,第i时刻周期性指数为第i时刻业务指数与第i-1时刻水平平滑值、第i-1时刻趋势平滑值的差值。
例如,三次指数平滑公式为:pi=γ(xi-si-1-ti-1)+(1-γ)pi-k
其中,三次指数平滑公式表示季节性方程,γ为第三平滑参数,pi代表第i个周期性指数(xi-si-1-ti-1)和上一周期同期(即k个时间段前)的周期性指数之间的加权平均值。可知,三次指数平滑公式可以表示数据每个周期内的变化,能够获取到业务指标序列的周期性信息。
需要说明的是,上述公式中i是表示计数的量,为了给每个业务指标一个编号,所以一般是[0,N),N表示所有业务指标的数量,并且需要先设定初始值s0、t0、p0,对于这几个初始值的设定并不非常重要,这是因为,指数式衰减规律说明所有的指数平滑方法的“记忆”能力都是很短的,只需经过几个时间步长,即i值的增加,初始值的影响就会变得非常小,因此,可以简单地设置初始值均为0或1等,也可以基于其它方式设置初始值,本申请实施例中并不进行限制。另外,对于上述预测公式、一次指数平滑公式、二次指数平滑公式和三次指数平滑公式中s、p、t的下标小于等于0时,可以认为均取值为0。
基于上述实施例中预测公式,以及一次指数平滑公式、二次指数平滑公式和三次指数平滑公式,则执行步骤320时,具体包括:
S1、根据历史业务指标序列和训练确定的各平滑参数,分别确定历史参考时刻的水平平滑值、历史参考时刻的趋势平滑值和目标时刻上一周期对应的时刻的周期平滑值,其中,各平滑参数的取值范围均为[0,1]。
基于上述预测公式可知,已知历史业务指标序列,则只需要确定三个平滑参数即可,通过训练可以确定并选择最优的第一平滑参数、第二平滑参数和第三平滑参数的取值,进而可以基于第一平滑参数、第二平滑参数和第三平滑参数,以及上述一次指数平滑公式、二次指数平滑公式和三次指数平滑公式,分别计算出历史参考时刻的水平平滑值、历史参考时刻的趋势平滑值和目标时刻上一周期对应的时刻的周期平滑值。
例如,针对工作时段(一天工作12小时,从早十点到晚十点),以1小时为设定波动时间,每天12个(即12个时间段)业务指标,获取的历史业务指标序列为连续二周和第三周星期一从早十点到13点的业务指标,则共有12*7*2+3=171,从0到170编号,若预测第三周星期一15点的业务指标,则目标时刻为第三周星期一15点,其对应编号为172,例如确定历史参考时刻为第三周星期一13点,其对应编码为170,周期k为12,则目标时刻和历史参考时刻的跨度差值h为2,基于一次指数平滑公式、二次指数平滑公式、三次指数平滑公式,可以分别计算出s170、t170、以及p170-12+(2mod12)=p160,即上一周期同一时期的周期平滑值。
S2、根据跨度差值,以及历史参考时刻的水平平滑值、历史参考时刻的趋势平滑值、目标时刻上一周期对应的时刻的周期平滑值,确定目标时刻的业务指标。
例如,基于上述预测公式,可知x170+2=s170+2t170+p160,即可以预测出第三周星期一15点的业务指标的取值。
本申请实施例中,获取历史业务指标序列,并确定目标时刻与历史参考时刻的跨度差值,进而可以基于三次指数平滑模型,根据跨度差值、历史业务指标序列和训练确定的各平滑参数,预测目标时刻的业务指标,这样,基于三次指数平滑模型进行预测,能够挖掘时间序列的周期性和趋势性信息,相对于仅采用天粒度平均值预测,以设定波动时间为粒度,可以更加贴合实际应用场景,可以描述设定波动时间的各个业务指标的周期性,并能够预测趋势变化,提高预测准确性。
基于上述实施例,下面对本申请实施例中的三次指数平滑模型的训练方式进行说明。
本申请实施例中,基于三次指数平滑模型的预测公式可知,训练三次指数平滑模型主要是确定第一平滑参数、第二平滑参数和第三平滑参数的取值。具体三次指数平滑模型的训练方式为:
S1、获取业务指标样本序列训练集,其中,训练集中包括N1个连续时间前后顺序排列的业务指标样本。
进一步地,为保证数据可靠性和训练的准确性,还可以对业务指标样本进行筛选预处理,具体地,获取业务指标样本序列训练集之后,还包括:筛选出业务指标样本序列训练集中的变化率超过阈值的业务指标样本;针对筛选出的各业务指标样本,分别根据对应前后两个时刻的业务指标的平均值,对筛选出的各业务指标样本进行修改。
S2、基于业务指标样本序列训练集,训练三次指数平滑模型,直至三次指数平滑模型的预测结果均方根误差或正规化的均方根误差最小化,获得训练确定的各平滑参数,并获得训练完成的三次指数平滑模型。
下面采用一个具体应用场景对三次指数平滑模型的整体训练过程进行具体说明,参阅图4所示,为本申请实施例中三次指数平滑模型训练方法流程图,该方法包括:
步骤400:获取原始业务指标样本序列。
例如,预测宕机受影响销售额场景时,可以获取宕机发生前N个连续的销售额,第i个值为xi。并且考虑到在销售额场景中通常存在以天和周的周期性,因此,例如获取连续的10周销售额数据,每天工作时刻12个数据,则共获取到10*7*12=840个,例如i的范围[1,840]。
步骤401:进行数据预处理。
这是因为,考虑到可能存在一些不可信或错误数据,会影响训练准确性,因此可以对获取到的原始业务指标样本序列,进行预处理,筛选出变化率超过阈值的业务指标样本,并分别根据对应前后两个时刻的业务指标的平均值,对筛选出的各业务指标样本进行修改。
步骤402:确定训练集和测试集。
具体地,针对获取到的原始业务指标样本序列,从中分别选择一部分作为训练集,另一部分作为测试集。
例如,N个原始业务指标样本序列,则可以选择前N1个连续的原始业务指标样本序列作为训练集,剩下N-N1个连续的原始业务指标样本序列作为测试集。
步骤403:建模及调参方式选择。
本申请实施例中,针对具体应用场景中具有季节性和趋势性的业务指标序列,可以采用三次指数平滑加性模型,其预测公式为:
xi+h=si+hti+pi-k+(hmodk)
可知,模型训练主要需要调优的参数有三个:α,β,γ,其中,α,β,γ的取值范围均为[0,1],越接近1,平滑后的值越接近当前时间的数据值(下标为i的值),数据越不平滑,越接近0,平滑后的值越接近前i个数据的平滑值,数据越平滑。
对三次指数平滑模型进行训练主要是为了训练获得三个平滑参数α,β,γ的取值,只有采用合适的平滑参数进行平滑信息提取,才会得到最优的预测效果,因此需要利用训练集进行模型训练和参数调优,从而训练确定使验证数据拟合效果最好的平滑参数后,利用这些平滑参数进行测试集的预测,例如实际场景中对宕机时的销售额进行预测。
其中,调参方式可以采用最小二乘法进行调优,最终获得使预测结果均方根误差或正规化的均方根误差最小的各平滑参数。
步骤404:训练三次指数平滑模型,计算模型评价指标。
具体地,基于业务指标样本序列训练集,训练三次指数平滑模型,直至三次指数平滑模型的预测结果均方根误差或正规化的均方根误差最小化,获得训练确定的各平滑参数,并获得训练完成的三次指数平滑模型。
其中,模型评价指标即表示预测结果均方根误差或正规化的均方根误差。具体参阅表1所示,为本申请实施例中模型评价指标示例。
表1.
Figure BDA0002514860400000131
本申请实施例中可以采用均方根误差,也可以采用正规化的均方根误差进行三次指数平滑模型训练的评价,当然也可以采用其它模型评价指标,本申请实施例中并不进行限制。
步骤405:三次指数平滑模型调优。
本申请实施例中考虑到选取多少个连续的业务指标样本序列,对三次指数平滑模型的训练效果是有影响的,因此,可以使用不同大小的训练集,分别对三次指数平滑模型进行训练,对比不同大小训练集的预测效果,然后选择最优大小训练集的训练结果,可以进一步提高三次指数平滑模型训练准确性。例如参阅表2所示,为本申请实施例中不同大小训练集预测效果对比。
表2.
Figure BDA0002514860400000141
需要说明的是,表2中n1到n6表示不同数量的连续的业务指标样本序列,且n1,...,n6<=N1,这里仅是为了示意说明不同大小训练集对模型训练的影响,并不需要指代具体数值,从表2中可知,通过改变训练集大小,对比预测结果NRMSE,得出采用n3个连续的业务指标样本序列,作为训练集训练的三次指数平滑模型效果最好,NRMSE达到0.166。
这样,本申请实施例中,采用三次指数平滑模型进行业务指标预测可以描述业务指标的趋势性和周期性等,并且在训练三次指数平滑模型时,结合实际应用场景,选择设定波动时间粒度的业务指标,例如以1小时为时间单位,并且通过训练对比,选择更加合理的训练集和模型评价指标,从而提高三次指数平滑模型训练的准确性和预测效果。
基于上述实施例,采用具体应用场景本申请实施例中的三次指数平滑模型的预测效果进行说明,参阅图5所示,为本申请实施例中一种业务指标预测方法效果示意图。
图5中示例了相关技术中的现有策略的预测结果NRMSE和本申请实施例中三次指数平滑模型预测结果NRMSE,通过对比可知,本申请实施例中基于三次指数平滑模型的预测结果NRMSE为0.166,明显低于相关技术中预测结果NRMSE的0.515,优化增幅大概为(0.515-0.166)/0.515=67.75%。
又例如,以业务指标为销售额为例,参阅图6所示,为本申请实施例中另一种业务指标预测方法效果示意图,图6是针对真实值、相关技术的预测值以及本申请实施例中基于三次指数平滑模型的预测值的结果展示对比,横坐标为时间,纵坐标为每小时销售额,其中,图6中波动较小的线表示相关技术的预测值,两条波动较大的线(基本交织在一起)中一条颜色较浅的线为本申请实施例中基于三次指数平滑模型的预测值,另一条颜色较深的线为真实值,从图6中可知,本申请实施例中的业务指标预测方法,预测获得的销售额的数值,更加贴近真实值,并且可以预测出销售额的变化趋势,还可以体现销售额的周期性变化,解决了相关技术中无法描述一天内工作时段销售额的周期性变化的问题,也更加符合实际应用场景,提高了预测准确性。
基于同一发明构思,本申请实施例中还提供了一种业务指标预测装置,该业务指标预测装置例如可以是前述实施例中的终端或服务器,该业务指标预测装置可以是硬件结构、软件模块、或硬件结构加软件模块。基于上述实施例,参阅图7所示,本申请实施例中业务指标预测装置,具体包括:
获取模块70,用于获取历史业务指标序列,其中,历史业务指标序列表征按照连续单位时间顺序排列的业务指标,并单位时间为各业务指标呈波动变化时对应的设定波动时间,设定波动时间对应的各业务指标按照时长时间呈周期性和趋势性变化,时长时间大于设定波动时间;
确定模块71,用于确定目标时刻与历史参考时刻的跨度差值,其中,历史参考时刻是从历史业务指标序列对应的时间中确定的;
预测模块72,用于基于三次指数平滑模型,根据跨度差值、历史业务指标序列和训练确定的各平滑参数,预测目标时刻的业务指标。
可选的,三次指数平滑模型包括预测公式,预测公式表征目标时刻的业务指标,与历史参考时刻的水平平滑值、历史参考时刻的趋势平滑值以及目标时刻上一周期对应的时刻的周期平滑值之间的关联关系;
则预测目标时刻的业务指标时,预测模块72具体用于:
根据历史业务指标序列和训练确定的各平滑参数,分别确定历史参考时刻的水平平滑值、历史参考时刻的趋势平滑值和目标时刻上一周期对应的时刻的周期平滑值,其中,各平滑参数的取值范围均为[0,1];
根据跨度差值,以及历史参考时刻的水平平滑值、历史参考时刻的趋势平滑值、目标时刻上一周期对应的时刻的周期平滑值,确定目标时刻的业务指标。
可选的,水平平滑值是基于一次指数平滑公式确定的,趋势平滑值是基于二次指数平滑公式确定的,周期平滑值是基于三次指数平滑公式确定的;
其中,一次指数平滑公式:第i时刻水平平滑值表示基于第一平滑参数,周期性调整后的第i时刻业务指标真实值和非周期性调整后的第i-1时刻业务指标水平平滑值之间的加权平均,二次指数平滑公式:第i时刻趋势平滑值表示基于第二平滑参数,第i时刻水平平滑值与第i-1时刻水平平滑值的差值,和第i-1时刻趋势平滑值的加权平均,三次指数平滑公式:第i时刻周期平滑值表示基于第三平滑参数,第i时刻周期性指数和上一周期对应时刻周期平滑值之间的加权平均,第i时刻周期性指数为第i时刻业务指数与第i-1时刻水平平滑值、第i-1时刻趋势平滑值的差值。
可选的,针对三次指数平滑模型的训练方式,还包括训练模块73,用于:
获取业务指标样本序列训练集,其中,训练集中包括N1个连续时间前后顺序排列的业务指标样本;
基于业务指标样本序列训练集,训练三次指数平滑模型,直至三次指数平滑模型的预测结果均方根误差或正规化的均方根误差最小化,获得训练确定的各平滑参数,并获得训练完成的三次指数平滑模型。
可选的,获取历史业务指标序列之后,还包括第一预处理模块74,用于
筛选出历史业务指标序列中的变化率超过阈值的业务指标;
针对筛选出的各业务指标,分别根据对应前后两个时刻的业务指标的平均值,对筛选出的各业务指标进行修改。
可选的,获取业务指标样本序列训练集之后,还包括第二预处理模块75,用于:
筛选出业务指标样本序列训练集中的变化率超过阈值的业务指标样本;
针对筛选出的各业务指标样本,分别根据对应前后两个时刻的业务指标的平均值,对筛选出的各业务指标样本进行修改。
基于上述实施例,参阅图8所示为本申请实施例中电子设备的结构示意图。
本申请实施例提供了一种电子设备,该电子设备可以包括处理器810(CenterProcessing Unit,CPU)、存储器820、输入设备830和输出设备840等,输入设备830可以包括键盘、鼠标、触摸屏等,输出设备840可以包括显示设备,如液晶显示器(Liquid CrystalDisplay,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器820可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器810提供存储器820中存储的程序指令和数据。在本申请实施例中,存储器820可以用于存储本申请实施例中任一种业务指标预测方法的程序。
处理器810通过调用存储器820存储的程序指令,处理器810用于按照获得的程序指令执行本申请实施例中任一种业务指标预测方法。
基于上述实施例,本申请实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意方法实施例中的业务指标预测方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种业务指标预测方法,其特征在于,包括:
获取历史业务指标序列,其中,所述历史业务指标序列表征按照连续单位时间顺序排列的业务指标,并所述单位时间为各业务指标呈波动变化时对应的设定波动时间,所述设定波动时间对应的各业务指标按照时长时间呈周期性和趋势性变化,所述时长时间大于所述设定波动时间;
确定目标时刻与历史参考时刻的跨度差值,其中,所述历史参考时刻是从所述历史业务指标序列对应的时间中确定的;
基于三次指数平滑模型,根据所述跨度差值、所述历史业务指标序列和训练确定的各平滑参数,预测所述目标时刻的业务指标。
2.如权利要求1所述的方法,其特征在于,所述三次指数平滑模型包括预测公式,所述预测公式表征所述目标时刻的业务指标,与所述历史参考时刻的水平平滑值、所述历史参考时刻的趋势平滑值以及所述目标时刻上一周期对应的时刻的周期平滑值之间的关联关系;
则预测所述目标时刻的业务指标,具体包括:
根据所述历史业务指标序列和训练确定的各平滑参数,分别确定所述历史参考时刻的水平平滑值、所述历史参考时刻的趋势平滑值和所述目标时刻上一周期对应的时刻的周期平滑值,其中,所述各平滑参数的取值范围均为[0,1];
根据所述跨度差值,以及所述历史参考时刻的水平平滑值、所述历史参考时刻的趋势平滑值、所述目标时刻上一周期对应的时刻的周期平滑值,确定所述目标时刻的业务指标。
3.如权利要求2所述的方法,其特征在于,所述水平平滑值是基于一次指数平滑公式确定的,所述趋势平滑值是基于二次指数平滑公式确定的,所述周期平滑值是基于三次指数平滑公式确定的;
其中,所述一次指数平滑公式:第i时刻水平平滑值表示基于第一平滑参数,周期性调整后的第i时刻业务指标真实值和非周期性调整后的第i-1时刻业务指标水平平滑值之间的加权平均,所述二次指数平滑公式:第i时刻趋势平滑值表示基于第二平滑参数,第i时刻水平平滑值与第i-1时刻水平平滑值的差值,和第i-1时刻趋势平滑值的加权平均,所述三次指数平滑公式:第i时刻周期平滑值表示基于第三平滑参数,第i时刻周期性指数和上一周期对应时刻周期平滑值之间的加权平均,所述第i时刻周期性指数为第i时刻业务指数与第i-1时刻水平平滑值、第i-1时刻趋势平滑值的差值。
4.如权利要求1所述的方法,其特征在于,所述三次指数平滑模型的训练方式为:
获取业务指标样本序列训练集,其中,所述训练集中包括N1个连续时间前后顺序排列的业务指标样本;
基于所述业务指标样本序列训练集,训练所述三次指数平滑模型,直至所述三次指数平滑模型的预测结果均方根误差或正规化的均方根误差最小化,获得训练确定的各平滑参数,并获得训练完成的三次指数平滑模型。
5.如权利要求1所述的方法,其特征在于,获取历史业务指标序列之后,进一步包括:
筛选出所述历史业务指标序列中的变化率超过阈值的业务指标;
针对筛选出的各业务指标,分别根据对应前后两个时刻的业务指标的平均值,对筛选出的各业务指标进行修改。
6.如权利要求4所述的方法,其特征在于,获取业务指标样本序列训练集之后,进一步包括:
筛选出所述业务指标样本序列训练集中的变化率超过阈值的业务指标样本;
针对筛选出的各业务指标样本,分别根据对应前后两个时刻的业务指标的平均值,对筛选出的各业务指标样本进行修改。
7.一种业务指标预测装置,其特征在于,包括:
获取模块,用于获取历史业务指标序列,其中,所述历史业务指标序列表征按照连续单位时间顺序排列的业务指标,并所述单位时间为各业务指标呈波动变化时对应的设定波动时间,所述设定波动时间对应的各业务指标按照时长时间呈周期性和趋势性变化,所述时长时间大于所述设定波动时间;
确定模块,用于确定目标时刻与历史参考时刻的跨度差值,其中,所述历史参考时刻是从所述历史业务指标序列对应的时间中确定的;
预测模块,用于基于三次指数平滑模型,根据所述跨度差值、所述历史业务指标序列和训练确定的各平滑参数,预测所述目标时刻的业务指标。
8.如权利要求7所述的装置,其特征在于,所述三次指数平滑模型包括预测公式,所述预测公式表征所述目标时刻的业务指标,与所述历史参考时刻的水平平滑值、所述历史参考时刻的趋势平滑值以及所述目标时刻上一周期对应的时刻的周期平滑值之间的关联关系;
则预测所述目标时刻的业务指标时,预测模块具体用于:
根据所述历史业务指标序列和训练确定的各平滑参数,分别确定所述历史参考时刻的水平平滑值、所述历史参考时刻的趋势平滑值和所述目标时刻上一周期对应的时刻的周期平滑值,其中,所述各平滑参数的取值范围均为[0,1];
根据所述跨度差值,以及所述历史参考时刻的水平平滑值、所述历史参考时刻的趋势平滑值、所述目标时刻上一周期对应的时刻的周期平滑值,确定所述目标时刻的业务指标。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-6任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。
CN202010472750.4A 2020-05-29 2020-05-29 一种业务指标预测方法及装置 Pending CN111695791A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010472750.4A CN111695791A (zh) 2020-05-29 2020-05-29 一种业务指标预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010472750.4A CN111695791A (zh) 2020-05-29 2020-05-29 一种业务指标预测方法及装置

Publications (1)

Publication Number Publication Date
CN111695791A true CN111695791A (zh) 2020-09-22

Family

ID=72478818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010472750.4A Pending CN111695791A (zh) 2020-05-29 2020-05-29 一种业务指标预测方法及装置

Country Status (1)

Country Link
CN (1) CN111695791A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132485A (zh) * 2020-09-30 2020-12-25 上海众源网络有限公司 一种指标数据处理方法、装置、电子设备及存储介质
CN112749845A (zh) * 2021-01-13 2021-05-04 中国工商银行股份有限公司 模型训练方法、资源数据预测方法、装置和计算设备
CN112766698A (zh) * 2021-01-13 2021-05-07 中国工商银行股份有限公司 应用业务压力确定方法及装置
CN112990563A (zh) * 2021-03-05 2021-06-18 东南大学 一种高速公路追尾事故风险实时预测方法
CN113129127A (zh) * 2021-04-21 2021-07-16 建信金融科技有限责任公司 预警方法和装置
CN113128787A (zh) * 2021-05-10 2021-07-16 携程旅游网络技术(上海)有限公司 话务量预测方法、系统、设备及介质
CN113778784A (zh) * 2021-07-30 2021-12-10 北京达佳互联信息技术有限公司 目标应用的用户数量确定方法和装置、电子设备及存储介质
CN113850418A (zh) * 2021-09-02 2021-12-28 支付宝(杭州)信息技术有限公司 时间序列中异常数据的检测方法和装置
CN114418071A (zh) * 2022-01-24 2022-04-29 中国光大银行股份有限公司 循环神经网络训练方法
CN115495321A (zh) * 2022-11-18 2022-12-20 天河超级计算淮海分中心 一种超算节点使用状态自动识别方法
CN116149865A (zh) * 2023-04-10 2023-05-23 之江实验室 一种变频执行任务的方法、装置、设备及可读存储介质
CN117612737A (zh) * 2024-01-24 2024-02-27 胜利油田中心医院 一种糖尿病护理数据智能优化方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132485A (zh) * 2020-09-30 2020-12-25 上海众源网络有限公司 一种指标数据处理方法、装置、电子设备及存储介质
CN112766698B (zh) * 2021-01-13 2024-02-09 中国工商银行股份有限公司 应用业务压力确定方法及装置
CN112749845A (zh) * 2021-01-13 2021-05-04 中国工商银行股份有限公司 模型训练方法、资源数据预测方法、装置和计算设备
CN112766698A (zh) * 2021-01-13 2021-05-07 中国工商银行股份有限公司 应用业务压力确定方法及装置
CN112990563A (zh) * 2021-03-05 2021-06-18 东南大学 一种高速公路追尾事故风险实时预测方法
CN113129127A (zh) * 2021-04-21 2021-07-16 建信金融科技有限责任公司 预警方法和装置
CN113128787A (zh) * 2021-05-10 2021-07-16 携程旅游网络技术(上海)有限公司 话务量预测方法、系统、设备及介质
CN113778784A (zh) * 2021-07-30 2021-12-10 北京达佳互联信息技术有限公司 目标应用的用户数量确定方法和装置、电子设备及存储介质
CN113778784B (zh) * 2021-07-30 2024-03-26 北京达佳互联信息技术有限公司 目标应用的用户数量确定方法和装置、电子设备及存储介质
CN113850418A (zh) * 2021-09-02 2021-12-28 支付宝(杭州)信息技术有限公司 时间序列中异常数据的检测方法和装置
CN114418071A (zh) * 2022-01-24 2022-04-29 中国光大银行股份有限公司 循环神经网络训练方法
CN115495321A (zh) * 2022-11-18 2022-12-20 天河超级计算淮海分中心 一种超算节点使用状态自动识别方法
CN116149865A (zh) * 2023-04-10 2023-05-23 之江实验室 一种变频执行任务的方法、装置、设备及可读存储介质
CN117612737A (zh) * 2024-01-24 2024-02-27 胜利油田中心医院 一种糖尿病护理数据智能优化方法
CN117612737B (zh) * 2024-01-24 2024-05-03 胜利油田中心医院 一种糖尿病护理数据智能优化方法

Similar Documents

Publication Publication Date Title
CN111695791A (zh) 一种业务指标预测方法及装置
US10248528B2 (en) System monitoring method and apparatus
Meinshausen et al. Monte Carlo methods for the valuation of multiple‐exercise options
US11645293B2 (en) Anomaly detection in big data time series analysis
CN105205297B (zh) 一种基于时间序列的业务预测方法及系统
US7171340B2 (en) Computer-implemented regression systems and methods for time series data analysis
CN109495318B (zh) 一种移动通信网络流量预测方法、装置及可读存储介质
CN112037930B (zh) 一种传染病预测设备、方法、装置及存储介质
EP3576038A1 (en) Trade platform with reinforcement learning
CN111478963B (zh) 消息推送方法、装置、电子设备及计算机可读存储介质
US20070033123A1 (en) Estimating risk of a portfolio of financial investments
US20070130041A1 (en) Systems and methods for valuing a derivative involving a multiplicative index
US8645259B1 (en) Mitigating risk associated with executing limit orders for trading securities
Liu The effects of international shocks on Australia's business cycle
CN110569190B (zh) 交易压力测试方法和装置、以及电子设备和可读存储介质
CN112150214A (zh) 一种数据预测方法、装置以及计算机可读存储介质
Li et al. Jump factor models in large cross‐sections
US11978071B2 (en) Methods and apparatus to determine reach with time dependent weights
CN111583010A (zh) 一种数据处理方法、装置、设备及存储介质
CN110826949A (zh) 产能控制实现方法和装置
CN113343577B (zh) 一种基于机器学习的参数优化方法、装置、设备及介质
WO2022227219A1 (zh) 房产指数数据分析方法、装置、设备及存储介质
CN108122050A (zh) 时间预估方法、装置、电子设备及计算机可读存储介质
CN111164633B (zh) 一种评分卡模型的调整方法、装置、服务器及存储介质
CN113129127A (zh) 预警方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination