CN109284861A - 预测处理方法、介质、装置和计算设备 - Google Patents

预测处理方法、介质、装置和计算设备 Download PDF

Info

Publication number
CN109284861A
CN109284861A CN201811013063.5A CN201811013063A CN109284861A CN 109284861 A CN109284861 A CN 109284861A CN 201811013063 A CN201811013063 A CN 201811013063A CN 109284861 A CN109284861 A CN 109284861A
Authority
CN
China
Prior art keywords
prediction
value
error
sample
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811013063.5A
Other languages
English (en)
Inventor
邱显
王迪
张荣燊
杨杰
罗晓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Netease Zaigu Technology Co Ltd
Original Assignee
Hangzhou Netease Zaigu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Netease Zaigu Technology Co Ltd filed Critical Hangzhou Netease Zaigu Technology Co Ltd
Priority to CN201811013063.5A priority Critical patent/CN109284861A/zh
Publication of CN109284861A publication Critical patent/CN109284861A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的实施方式提供了一种预测处理方法、介质、装置和计算设备。该预测处理方法包括:获取针对目标对象的预测样本和所述预测样本对应的观测样本;基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标;根据所述多个预测误差指标对所述目标对象的预测效果进行评估。本发明实施例的技术方案可以通过多个预测误差指标共同评估预测效果,进而能够保证评估结果尽可能准确反映实际的预测效果,提高了评估结果的准确性,避免了采用单一指标来评估预测结果而可能会造成预测值相比于观测值的均值偏大或偏小的问题。

Description

预测处理方法、介质、装置和计算设备
技术领域
本发明的实施方式涉及通信及计算机技术领域,更具体地,本发明的实施方式涉及预测处理方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
销量预测通常是预测单个商品或多个商品在多个时段的销量,由于产品销售的不确定性,并不能精确地预测每个时段的销量值,因此只能从总体上去评估多个预测值与多个真实销量值之间的差异。
发明内容
但是,目前在评估预测值与真实销量值之间的差异时,基本上都是通过一种误差指标来进行评估,这种方式会造成评估结果不能准确反映实际情况,进而出现预测值相比于观测值的均值偏大或偏小的问题。
为此,非常需要一种改进的预测处理方案,可以确保评估结果尽可能准确反映实际的预测效果,进而提高评估结果的准确性,避免采用单一指标来评估预测结果而可能会造成预测值相比于观测值的均值偏大或偏小的问题。
在本上下文中,本发明的实施方式期望提供一种预测处理方法、介质、装置和计算设备。
在本发明实施方式的第一方面中,提供了一种预测处理方法,包括:获取针对目标对象的预测样本和所述预测样本对应的观测样本;基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标;根据所述多个预测误差指标对所述目标对象的预测效果进行评估。
在本发明的一些实施例中,基于前述方案,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标,包括:根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的绝对百分比误差,其中,预测值和观测值均为0的第一预测时间段内的所述绝对百分比误差为第一设定值;根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,计算各个预测时间段内的预测值与观测值的绝对百分比误差,包括:对于预测值和观测值不全为0的第二预测时间段,计算所述第二预测时间段内的预测值与观测值的差值,并计算所述第二预测时间段内的预测值与观测值的和值;计算所述第二预测时间段内的所述差值与所述和值之间的比值,将所述比值与第二设定值的乘积的绝对值作为所述第二预测时间段内的所述绝对百分比误差。
在本发明的一些实施例中,基于前述方案,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果多个预测误差指标,包括:根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差;根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差,包括:计算所述各个预测时间段内的预测值与观测值的差值,并计算所述各个预测时间段内的所述差值与观测值之间的比值的绝对值;计算所述各个预测时间段内的所述绝对值的反正切值,以作为所述各个时间段内的所述反正切绝对百分比误差。
在本发明的一些实施例中,基于前述方案,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标,包括:根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对比例误差;根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,所述各个预测时间段内的预测值与观测值的反正切绝对比例误差为arctan(qt),其中,
xt表示预测时间段t内的预测值;yt表示预测时间段t内的观测值;n表示预测时间段的个数且n≥2。
在本发明的一些实施例中,基于前述方案,根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,包括:计算所述各个预测时间段内的所述反正切绝对比例误差与第三设定值的乘积;计算所述各个预测时间段对应的所述乘积的均值,将所述均值作为所述平均反正切绝对比例误差。
在本发明的一些实施例中,基于前述方案,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标,包括:对所述观测样本进行多项式平滑处理,得到所述观测样本对应的拟合样本;根据所述预测样本和所述观测样本对应的拟合样本,计算所述多个预测误差指标。
在本发明的一些实施例中,基于前述方案,对所述观测样本进行多项式平滑处理,包括:将所述观测样本分为m段样本;根据所述m段样本,生成子样本;对所述子样本进行多项式回归处理,得到每个所述子样本对应的多项式;基于每个所述子样本对应的多项式生成所述观测样本对应的拟合样本。
在本发明的一些实施例中,基于前述方案,根据以下公式生成所述子样本:
Yi={y(i-1)b+1,y(i-1)b+2,…,y(i-1)b+b}
其中,Yi表示第i个子样本;y(i-1)b+b表示预测时间段(i-1)b+b内的观测值;b表示所述m段样本中每段样本的长度。
在本发明的一些实施例中,基于前述方案,基于每个所述子样本对应的多项式生成所述观测样本对应的拟合样本,包括:基于每个所述子样本对应的多项式生成每个所述子样本对应的拟合样本;根据每个所述子样本对应的拟合样本,生成所述观测样本对应的拟合样本。
在本发明的一些实施例中,基于前述方案,根据以下公式生成每个所述子样本对应的拟合样本:
Fi={pi,k((i-1)b+1),pi,k((i-1)b+2),…,pi,k((i-1)b+b)}
其中,Fi表示第i个子样本对应的拟合样本;pi,k()表示通过k阶多项式对第i个子样本进行多项式回归处理得到的多项式;1≤k≤b+1。
在本发明的一些实施例中,基于前述方案,通过以下公式生成所述观测样本对应的拟合样本:
F=F1∪F2∪…Fm∪Ytail
其中,F表示所述观测样本对应的拟合样本;n表示所述观测样本的总长度。
在本发明的一些实施例中,基于前述方案,根据所述预测样本和所述观测样本对应的拟合样本,计算所述多个预测误差指标,包括:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的绝对百分比误差,其中,预测值和所述拟合值均为0的第三预测时间段内的所述绝对百分比误差为第四设定值;根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,根据所述预测样本和所述观测样本对应的拟合样本,计算所述多个预测误差指标,包括:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对百分比误差;根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,根据所述预测样本和所述观测样本对应的拟合样本,计算所述多个预测误差指标,包括:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对比例误差;根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,所述目标对象包括多个对象;基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标,包括:基于各个所述对象的预测样本和观测样本,分别计算各个所述对象的所述多个预测误差指标;基于各个所述对象的所述多个预测误差指标,分别计算所述多个对象整体的多个预测误差指标。
在本发明的一些实施例中,基于前述方案,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标,包括:基于所述观测样本对应的第一预测样本和第二预测样本,计算所述第一预测样本和所述第二预测样本分别对应的多个预测误差指标;根据所述多个预测误差指标对所述目标对象的预测结果进行评估,包括:若所述第一预测样本对应的多个预测误差指标中有预定数量个预测误差指标大于所述第二预测样本对应的预测误差指标且误差指标的差值大于或等于阈值,则确定所述第二预测样本的预测效果优于所述第一预测样本的预测效果。
在本发明的一些实施例中,基于前述方案,所述预定数量大于所述多个预测误差指标的数量的一半。
在本发明的一些实施例中,基于前述方案,多个预测误差指标的数量为奇数个。
在本发明实施方式的第二方面中,提供了一种介质,其上存储有程序,该程序被处理器执行时实现如上述实施例中任一项所述的方法。
在本发明实施方式的第三方面中,提供了一种预测处理装置,包括:获取单元,用于获取针对目标对象的预测样本和所述预测样本对应的观测样本;处理单元,用于基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标;评估单元,用于根据所述多个预测误差指标对所述目标对象的预测效果进行评估。
在本发明的一些实施例中,基于前述方案,所述处理单元包括:第一计算单元,用于根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的绝对百分比误差,其中,预测值和观测值均为0的第一预测时间段内的所述绝对百分比误差为第一设定值;第二计算单元,用于根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,所述第一计算单元配置为:对于预测值和观测值不全为0的第二预测时间段,计算所述第二预测时间段内的预测值与观测值的差值,并计算所述第二预测时间段内的预测值与观测值的和值;计算所述第二预测时间段内的所述差值与所述和值之间的比值,将所述比值与第二设定值的乘积的绝对值作为所述第二预测时间段内的所述绝对百分比误差。
在本发明的一些实施例中,基于前述方案,所述处理单元包括:第三计算单元,用于根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差;第四计算单元,用于根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,所述第三计算单元配置为:计算所述各个预测时间段内的预测值与观测值的差值,并计算所述各个预测时间段内的所述差值与观测值之间的比值的绝对值;计算所述各个预测时间段内的所述绝对值的反正切值,以作为所述各个时间段内的所述反正切绝对百分比误差。
在本发明的一些实施例中,基于前述方案,所述计算单元包括:第五计算单元,用于根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对比例误差;第六计算单元,用于根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,所述各个预测时间段内的预测值与观测值的反正切绝对比例误差为arctan(qt),其中,
xt表示预测时间段t内的预测值;yt表示预测时间段t内的观测值;n表示预测时间段的个数且n≥2。
在本发明的一些实施例中,基于前述方案,所述第六计算单元配置为:计算所述各个预测时间段内的所述反正切绝对比例误差与第三设定值的乘积;计算所述各个预测时间段对应的所述乘积的均值,将所述均值作为所述平均反正切绝对比例误差。
在本发明的一些实施例中,基于前述方案,所述处理单元包括:平滑单元,用于对所述观测样本进行多项式平滑处理,得到所述观测样本对应的拟合样本;执行单元,用于根据所述预测样本和所述观测样本对应的拟合样本,计算所述多个预测误差指标。
在本发明的一些实施例中,基于前述方案,所述平滑单元配置为:将所述观测样本分为m段样本;根据所述m段样本,生成子样本;对所述子样本进行多项式回归处理,得到每个所述子样本对应的多项式;基于每个所述子样本对应的多项式生成所述观测样本对应的拟合样本。
在本发明的一些实施例中,基于前述方案,根据以下公式生成所述子样本:
Yi={y(i-1)b+1,y(i-1)b+2,…,y(i-1)b+b}
其中,Yi表示第i个子样本;y(i-1)b+b表示预测时间段(i-1)b+b内的观测值;b表示所述m段样本中每段样本的长度。
在本发明的一些实施例中,基于前述方案,所述平滑单元配置为:基于每个所述子样本对应的多项式生成每个所述子样本对应的拟合样本;根据每个所述子样本对应的拟合样本,生成所述观测样本对应的拟合样本。
在本发明的一些实施例中,基于前述方案,根据以下公式生成每个所述子样本对应的拟合样本:
Fi={pi,k((i-1)b+1),pi,k((i-1)b+2),…,pi,k((i-1)b+b)}
其中,Fi表示第i个子样本对应的拟合样本;pi,k()表示通过k阶多项式对第i个子样本进行多项式回归处理得到的多项式;1≤k≤b+1。
在本发明的一些实施例中,基于前述方案,通过以下公式生成所述观测样本对应的拟合样本:
F=F1∪F2∪…Fm∪Ytail
其中,F表示所述观测样本对应的拟合样本;n表示所述观测样本的总长度。
在本发明的一些实施例中,基于前述方案,所述执行单元配置为:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的绝对百分比误差,其中,预测值和所述拟合值均为0的第三预测时间段内的所述绝对百分比误差为第四设定值;根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,所述执行单元配置为:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对百分比误差;根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个预测误差指标。
在本发明的一些实施例中,基于前述方案,所述执行单元配置为:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对比例误差;根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,所述目标对象包括多个对象;所述处理单元配置为:基于各个所述对象的预测样本和观测样本,分别计算各个所述对象的所述多个预测误差指标;基于各个所述对象的所述多个预测误差指标,分别计算所述多个对象整体的多个预测误差指标。
在本发明的一些实施例中,基于前述方案,所述处理单元配置为:基于所述观测样本对应的第一预测样本和第二预测样本,计算所述第一预测样本和所述第二预测样本分别对应的多个预测误差指标;所述评估单元配置为:若所述第一预测样本对应的多个预测误差指标中有预定数量个预测误差指标大于所述第二预测样本对应的预测误差指标且误差指标的差值大于或等于阈值,则确定所述第二预测样本的预测效果优于所述第一预测样本的预测效果。
在本发明的一些实施例中,基于前述方案,所述预定数量大于所述多个预测误差指标的数量的一半。
在本发明的一些实施例中,基于前述方案,多个预测误差指标的数量为奇数个。
根据本发明实施方式的第四方面,提供了一种计算设备,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如上述实施例中所述的方法。
根据本发明实施方式的预测处理方法、介质、装置和计算设备,通过根据针对目标对象的预测样本和观测样本,计算针对目标对象的预测效果的多个预测误差指标,以根据该多个预测误差指标对目标对象的预测效果进行评估,使得可以通过多个预测误差指标共同评估预测效果,进而能够保证评估结果尽可能准确反映实际的预测效果,提高了评估结果的准确性,避免了采用单一指标来评估预测结果而可能会造成预测值相比于观测值的均值偏大或偏小的问题。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性示出了根据本发明的第一个实施例的预测处理方法的流程图;
图2示意性示出了根据本发明的实施例的计算针对目标对象的预测效果的平均绝对百分比误差的流程图;
图3示意性示出了根据本发明的实施例的计算针对目标对象的预测效果的平均反正切绝对百分比误差的流程图;
图4示意性示出了根据本发明的实施例的计算针对目标对象的预测效果的平均反正切绝对比例误差的流程图;
图5示意性示出了根据本发明的第二个实施例的预测处理方法的流程图;
图6示意性示出了根据本发明的实施例的对观测样本进行多项式平滑处理的流程图;
图7示意性示出了根据本发明的一个实施例的预测处理装置的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种预测处理方法、介质、装置和计算设备。
在本文中,需要理解的是,所涉及的术语“预测时间段”是时间长度单位的统称,可以是一天、一周、一月、一年或任意长度的时间单位。
术语“预测样本”包含了多次预测过程的预测值;术语“观测样本”包含了多次观测过程的观测值。
术语“目标对象”是观测样本和预测样本所针对的对象,其可以表示某个类别的商品,也可以是与商品无关的需要被预测或观测的其它对象。
术语“预测误差指标”表示用于根据预测样本和观测样本评估预测效果的指标。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,目前在评估预测值与真实销量值之间的差异时,基本上都是通过一种误差指标来进行评估,这种方式会造成评估结果不能准确反映实际情况,进而出现预测值相比于观测值的均值偏大或偏小的问题。
因此,本发明的实施例提供了一种预测处理方法、介质、装置和计算设备,可以确保评估结果尽可能准确反映实际的预测效果,进而提高评估结果的准确性,避免采用单一指标来评估预测结果而可能会造成预测值相比于观测值的均值偏大或偏小的问题。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
需要注意的是,下述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
在本发明的一个应用场景中,可以对商品的销量预测效果进行评估,具体地,获取针对某个商品/某些商品的预测销量和相应的观测销量(即实际销量),然后基于这个商品/这些商品的预测销量和相应的观测销量,计算针对这个商品/这些商品的预测效果的多个预测误差指标,进而基于这多个预测误差指标来对这个商品/这些商品的销量预测效果进行评估,并基于评估结果反馈调节销量预测模型。
示例性方法
下面结合上述的应用场景,参考图1至图6来描述根据本发明示例性实施方式的预测处理方法。
图1示意性示出了根据本发明的第一个实施例的预测处理方法的流程图,该预测处理方法的执行主体可以是具有处理功能的各种设备,比如服务器、移动终端等。
参照图1所示,根据本发明的第一个实施例的预测处理方法,包括如下步骤S110、步骤S120和步骤S130,以下对各个步骤的实现细节进行详细阐述:
在步骤S110中,获取针对目标对象的预测样本和所述预测样本对应的观测样本。
在本发明的一个实施例中,预测样本包含了各个预测时间段内的预测值,观测样本包含了各个预测时间段内的观测值(即实际值)。其中,预测样本中的预测值与观测样本中的观测值是对应的关系,即一个预测时间段内的预测值对应于相应的观测值。
在步骤S120中,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标。
在本发明的一个实施例中,针对目标对象的预测效果的多个预测误差指标的数量可以为奇数个,比如可以是三个。这多个预测误差指标可以包括:平均绝对百分比误差、平均反正切绝对百分比误差、平均反正切绝对比例误差等。以下对如何计算这三个误差指标进行详细阐述:
计算平均绝对百分比误差
在本发明的一个实施例中,如图2所示,计算针对目标对象的预测效果的平均绝对百分比误差的过程可以包括:
步骤S210,根据预测样本和观测样本,计算各个预测时间段内的预测值与观测值的绝对百分比误差,其中,预测值和观测值均为0的第一预测时间段内的所述绝对百分比误差为第一设定值。
在本发明的一个实施例中,步骤S210中计算各个预测时间段内的预测值与观测值的绝对百分比误差,包括:对于预测值和观测值不全为0的第二预测时间段,计算所述第二预测时间段内的预测值与观测值的差值,并计算所述第二预测时间段内的预测值与观测值的和值;计算所述第二预测时间段内的所述差值与所述和值之间的比值,将所述比值与第二设定值的乘积的绝对值作为所述第二预测时间段内的所述绝对百分比误差。
该实施例的技术方案使得能够将预测值和观测值均为0的第一预测时间段内的绝对百分比误差设为第一设定值,进而能够保证计算得到的绝对百分比误差在始终有意义。
步骤S220,根据各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差。
在本发明的一个实施例中,可以根据各个预测时间段内的绝对百分比误差,计算所有预测时间段内的绝对百分比误差的平均值,并将该平均值作为所有预测时间段的平均绝对百分比误差。
计算平均反正切绝对百分比误差
在本发明的一个实施例中,如图3所示,计算针对目标对象的预测效果的平均反正切绝对百分比误差的过程可以包括:
步骤S310,根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差。
在本发明的一个实施例中,步骤S310中计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差的过程,具体可以包括:计算各个预测时间段内的预测值与观测值的差值,并计算各个预测时间段内的所述差值与观测值之间的比值的绝对值;计算各个预测时间段内的所述绝对值的反正切值,以作为各个时间段内的所述反正切绝对百分比误差。
步骤S320,根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差。
在本发明的一个实施例中,可以根据各个预测时间段内的反正切绝对百分比误差,计算所有预测时间段内的反正切绝对百分比误差的平均值,并将该平均值作为所有预测时间段的平均反正切绝对百分比误差。
计算平均反正切绝对比例误差
在本发明的一个实施例中,如图4所示,计算针对目标对象的预测效果的平均反正切绝对比例误差的过程可以包括:
步骤S410,根据预测样本和观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对比例误差。
在本发明的一个实施例中,各个预测时间段内的预测值与观测值的反正切绝对比例误差可以表示为arctan(qt),其中,
xt表示预测时间段t内的预测值;yt表示预测时间段t内的观测值;n表示预测时间段的个数且n≥2。
步骤S420,根据各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差。
在本发明的一个实施例中,可以计算各个预测时间段内的反正切绝对比例误差与第三设定值(该设定值可以是)的乘积,然后计算各个预测时间段对应的所述乘积的均值,并将该均值作为平均反正切绝对比例误差。
继续参照图1所示,在步骤S130中,根据所述多个预测误差指标对所述目标对象的预测效果进行评估。
在本发明的一个实施例中,可以通过一个观测样本对应的多个预测样本来对目标对象的预测效果进行评估,比如可以计算一个观测样本对应的第一预测样本和第二预测样本分别对应的多个预测误差指标,若第一预测样本对应的多个预测误差指标中有预定数量个预测误差指标大于第二预测样本对应的预测误差指标且误差指标的差值大于或等于阈值,则确定第二预测样本的预测效果优于第一预测样本的预测效果。优选地,该预定数量大于该多个预测误差指标的数量的一半。
前述实施例的技术方案通过多个预测误差指标共同评估预测效果,可以保证评估结果尽可能准确反映实际的预测效果,提高了评估结果的准确性,避免了采用单一指标来评估预测结果而可能会造成预测值相比于观测值的均值偏大或偏小的问题。
图5示意性示出了根据本发明的第二个实施例的预测处理方法的流程图,该预测处理方法的执行主体可以是具有处理功能的各种设备,比如服务器、移动终端等。
参照图5所示,根据本发明的第二个实施例的预测处理方法,包括如下步骤S510、步骤S520、步骤S530和步骤S540,以下对各个步骤的实现细节进行详细阐述:
在步骤S510中,获取针对目标对象的预测样本和所述预测样本对应的观测样本。
在本发明的一个实施例中,步骤S510的实现细节参照前述的步骤S110的实现细节。
在步骤S520中,对所述观测样本进行多项式平滑处理,得到所述观测样本对应的拟合样本。
在本发明的一个实施例中,如图6所示,步骤S520中对观测样本进行多项式平滑处理,包括:
步骤S610,将观测样本分为m段样本。
在本发明的一个实施例中,可以将观测样本平均分为m段样本。
步骤S620,根据所述m段样本,生成子样本。
在本发明的一个实施例中,可以根据以下公式生成所述子样本:
Yi={y(i-1)b+1,y(i-1)b+2,…,y(i-1)b+b}
其中,Yi表示第i个子样本;y(i-1)b+b表示预测时间段(i-1)b+b内的观测值;b表示所述m段样本中每段样本的长度。
步骤S630,对所述子样本进行多项式回归处理,得到每个所述子样本对应的多项式。
步骤S640,基于每个所述子样本对应的多项式生成所述观测样本对应的拟合样本。
在本发明的一个实施例中,可以基于每个子样本对应的多项式生成每个子样本对应的拟合样本,然后根据每个子样本对应的拟合样本,生成观测样本对应的拟合样本。
在本发明的一个实施例中,可以根据以下公式生成每个子样本对应的拟合样本:
Fi={pi,k((i-1)b+1),pi,k((i-1)b+2),…,pi,k((i-1)b+b)}
其中,Fi表示第i个子样本对应的拟合样本;pi,k()表示通过k阶多项式对第i个子样本进行多项式回归处理得到的多项式;1≤k≤b+1。
在本发明的一个实施例中,可以通过以下公式生成所述观测样本对应的拟合样本:
F=F1∪F2∪…Fm∪Ytail
其中,F表示所述观测样本对应的拟合样本;n表示所述观测样本的总长度。
继续参照图5所示,在步骤S530中,根据所述预测样本和所述观测样本对应的拟合样本,计算多个预测误差指标。
在本发明的一个实施例中,这多个预测误差指标可以包括:平均绝对百分比误差、平均反正切绝对百分比误差、平均反正切绝对比例误差等。以下对如何计算这三个误差指标进行详细阐述:
计算平均绝对百分比误差
在本发明的一个实施例中,可以根据预测样本和观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的绝对百分比误差,其中,预测值和所述拟合值均为0的第三预测时间段内的所述绝对百分比误差为第四设定值;然后根据各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差。
该实施例中的具体细节可以参照上述根据预测样本和观测样本来计算平均绝对百分比误差的方案。
计算平均反正切绝对百分比误差
在本发明的一个实施例中,可以根据预测样本和观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对百分比误差;然后根据各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差。
该实施例中的具体细节可以参照上述根据预测样本和观测样本来计算平均反正切绝对百分比误差的方案。
计算平均反正切绝对比例误差
在本发明的一个实施例中,可以根据预测样本和观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对比例误差;然后根据各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
该实施例中的具体细节可以参照上述根据预测样本和观测样本来计算平均反正切绝对比例误差的方案。
继续参照图5所示,在步骤S540中,根据所述多个预测误差指标对所述目标对象的预测效果进行评估。
在本发明的一个实施例中,步骤S540的实现细节参照前述的步骤S130的实现细节。
需要说明的是,前述实施例的目标对象可以是单个对象,也可以是多个对象,如果目标对象时多个对象,则可以基于各个对象的预测样本和观测样本,分别计算各个对象的多个预测误差指标,然后基于各个对象的多个预测误差指标,分别计算多个对象整体的多个预测误差指标,进而基于这多个对象整体的多个预测误差指标来对这多个对象的整体预测效果进行评估。
以下以对商品销量的预测效果进行评估为例,对本发明实施例的技术方案进行详细阐述。
在本发明的一个实施例中,若观测样本为y、预测样本为x,则误差指标可以定义为E(y,x)。假设一个观测样本y对应的两个预测样本分别为x1和x2(分别来自于两个预测模型M1和M2),那么如果E(y,x1)<E(y,x2),则认为M1的效果好于M2,反之亦然。
在对本发明实施例的技术方案进行阐述之前,先对相关技术中提出的三种评估方案进行简单说明:
评估方案1
在评估方案1中,将误差指标定义为:然后利用MAE的值来确定预测模型的效果好坏。其中,xt表示t时段的预测值;yt表示t时段的观测值;n表示预测及观测次数,每次为一个时段。
评估方案1的缺点在于:1)MAE的值依赖于标度(即观测样本的单位);2)不利于比较多个商品之间的预测效果;3)不利于同一商品的多个时段的预测效果之间的纵向比较。
评估方案2
在评估方案2中,将误差指标定义为:然后利用MAPE的值来确定预测模型的效果好坏。
评估方案2的缺点在于:
1)MAPE的值在yt=0时不可计算;
2)MAPE的值易受异常值影响:当yt非常小时易导致MAPE的值非常大;
3)MAPE的值不对称,易导致模型的预测值比观测值的均值明显偏小。具体地,假设那么在如下三种预测场景中pt的上界分别为:
a、低估时:xt<yt
b、完美估计时:xt=yt
c、高估时:xt>yt
那么可以得到如下等式:
由上述等式可知:当预测销量出现低估时,pt≤100;而出现高估时,pt的上界是+∞。因此如果使用MAPE来衡量预测误差,那么会导致预测模型的预测值会比观测值的均值明显偏小。
4)由于MAPE的值不对称,因此即使MAPE的值很小,也不一定能够体现出良好的预测效果。
评估方案3
在评估方案3中,将误差指标定义为:然后利用SMAPE的值来确定预测模型的效果好坏。
评估方案3的缺点在于:
1)xt=yt=0时,SMAPE的值没有定义;
2)假设那么在如下三种预测场景中qt的上界分别为:
理论上看,qt的值是对称的,但在实际中由于销量值往往是有界的,因此当模型高估时,xt远远小于正无穷,因此低估时qt的上界大于高估时qt的上界。如果用SMAPE的值作为误差指标,那么易导致预测值比观测值的均值偏大。
3)当yt或xt为0时,qt=200,即达到误差的上界。考虑到某个时段t,假设观测值yt=0,那么在时段t,无论预测值xt(xt≠0)是多少,误差值qt将达上界200.但实际上xt越小,模型在时段t的预测效果越好。因此,在这种场景下,模型无法通过qt的值捕捉到预测效果的差异。
基于上述评估模型存在的问题,本发明实施例提出了新的误差指标及评估方案,以下分别从单商品的误差评估及多商品的误差评估来进行说明:
单商品的误差评估方案1
定义新的误差指标:对称的平均绝对百分比误差(SMAPE)、平均反正切绝对百分比误差(MAAPE)和平均反正切绝对比例误差(MAASE)。
对称的平均绝对百分比误差其中
平均反正切绝对百分比误差
平均反正切绝对比例误差其中
上述三个误差指标的性质如下:
1)SMAPE的值域范围是[0,200],且始终有定义,如果用它单独作为误差评价指标易导致预测值比观测值的均值偏大。
2)MAAPE的值域范围是且始终有定义,如果用它单独作为误差评价指标易导致预测值比观测值的均值偏小。
3)MAASE的值域范围是[0,2],在绝大多数场景下有意义(除非所有的观测值相同,在这种场景下一般销量预测本身的意义不大)。它的目的不是直接体现观测样本y和预测样本x的误差,而是用来比较当前预测模型与“朴素模型”(即xt=yt-1)的差异,当MAASE<1时,可以认为当前模型比朴素模型的效果要好,否则它比朴素模型的效果要差。
基于上述的误差指标,本发明实施例提出的评估方案如下:
1、给定观测样本y和预测样本x,分别计算SMAPE的值、MAAPE的值和MAASE的值;
2、通过比较SMAPE的值、MAAPE的值和MAASE的值来选择模型和调整参数。具体方法如下:
考虑观测样本y和对应的预测样本x1和x2,其中预测样本x1和x2分别来自于两个不同的预测模型或来自于同一个预测模型的两种不同的参数配置,比较x1和x2的效果的流程如下:
(1)计算y和x1的三种误差值,即SMAPE的值、MAAPE的值和MAASE的值,并计算y和x2的三种误差值;
(2)比较x1对应的三种误差值与x2对应的三种误差值,如果x1对应的三种误差值中有两种“明显”比x2对应的误差值低,则认为x1比x2的效果好(其中,“明显”的程度可以通过参数来设置,而参数的值依赖实际中的业务场景);如果x2对应的三种误差值中有两种“明显”比x1对应的误差值低,则认为x2比x1的效果好;除前述两种情况外,可以认为x1与x2的效果相似。
单商品的误差评估方案2
给定观测样本y和预测样本x,在实际业务中,观测样本y中可能出现销量为0的值,例如商品某天缺货、长尾商品(真实销量就是0)、商品临时下架、数据发生异常。
在大多数情况下,0值对误差值会产生一定的影响,如果直接考虑这些0值,往往会对预测模型的稳定性产生一定影响,因此可以对观测样本进行平滑处理,比如进行多项式平滑处理。
在本发明的一个实施例中,多项式平滑处理的基本思想是把观测样本y分成m段,每段样本的长度为b,对每段样本用k阶多项式进行拟合处理,具体算法如下:
1、给定参数b,其中b是自然数,计算(或者给定参数m,计算);
2、定义子样本Yi={y(i-1)b+1,y(i-1)b+2,…,y(i-1)b+b},其中,i=1,2,……,m;
3、给定参数k,其中1≤k≤b+1,用k阶多项式对子样本Yi进行多项式回归,得到的多项式记为pi,k(x);
4、定义子样本Yi的拟合样本Fi,其中
Fi={pi,k((i-1)b+1),pi,k((i-1)b+2),…,pi,k((i-1)b+b)};
5、定义拟合样本F=F1∪F2∪…Fm∪Ytail,其中,
6、输出拟合样本F。
基于前述实施例中的多项式平滑处理方法,本发明实施例提出的评估方案如下:
1、根据业务场景选择合适的参数,对观测样本y采用分段的多项式平滑处理,输出拟合样本F;
2、计算拟合样本F和预测样本x的三个误差值,即SMAPE的值、MAAPE的值和MAASE的值;
3、通过比较SMAPE的值、MAAPE的值和MAASE的值来选择模型和调整参数。具体方法如下:
考虑观测样本y和对应的预测样本x1和x2,其中预测样本x1和x2分别来自于两个不同的预测模型或来自于同一个预测模型的两种不同的参数配置,比较x1和x2的效果的流程如下:
(1)计算F和x1的三种误差值,即SMAPE的值、MAAPE的值和MAASE的值,并计算F和x2的三种误差值;
(2)比较x1对应的三种误差值与x2对应的三种误差值,如果x1对应的三种误差值中有两种“明显”比x2对应的误差值低,则认为x1比x2的效果好(其中,“明显”的程度可以通过参数来设置,而参数的值依赖实际中的业务场景);如果x2对应的三种误差值中有两种“明显”比x1对应的误差值低,则认为x2比x1的效果好;除前述两种情况外,可以认为x1与x2的效果相似。
多商品的误差评估方案1
在本发明的一个实施例中,若给定多个商品的观测样本的集合为y1,……,ym;多个商品的预测样本的集合为x1,……,xm,那么可以定义多商品的误差指标如下:
其中MAAPEi表示根据预测样本xi和观测样本yi计算的MAAPE的值;
其中SMAPEi表示根据预测样本xi和观测样本yi计算的SMAPE的值;
其中MAASEi表示根据预测样本xi和观测样本yi计算的MAASE的值。
基于上述的误差指标,本发明实施例提出的多商品的评估方案如下:
1、给定观测样本的集合为y1,……,ym;预测样本的集合为x1,……,xm,,分别计算MSMAPE的值、MMAAPE的值和MMAASE的值;
2、通过比较MSMAPE的值、MMAAPE的值和MMAASE的值来选择模型和调整参数。具体方法与前述的单商品的评估方案类似。
多商品的误差评估方案2
1、根据业务场景选择合适的参数,对观测样本的集合y1,……,ym分别进行分段的多项式平滑处理,其对应的拟合样本分别为F1,……,Fm
2、计算拟合样本F1,……,Fm和预测样本x1,……,xm的误差值,即MSMAPE的值、MMAAPE的值和MMAASE的值;
3、通过比较MSMAPE的值、MMAAPE的值和MMAASE的值来选择模型和调整参数。具体方法与前述的单商品的评估方案类似。
本发明前述实施例的技术方案支持单商品/多商品在多个时段的预测结果评估,可以用来指导实际业务中各种各样的销量预测工作;并且提出了科学的误差指标和标准的计算公式来支持业务中绝大部分的应用场景;并且本发明实施例中的误差指标始终有界,且对异常值的敏感性较低,因此在实际的误差计算中误差值不会因为随机的销售波动而出现剧烈的变化,从而能真实体现预测模型本身的效果;此外,预测模型的提升与预测效果的提升能够保持一致,进而使得在按照本发明实施例中的评估方案来评估销量预测的效果并选择较好的预测模型时,能够得到较好的预测效果。
示例性介质
在介绍了本发明示例性实施方式的方法之后,接下来,对本发明示例性实施方式的介质进行说明。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种介质,其上存储有程序代码,当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的预测处理方法中的步骤。
具体地,所述设备的处理器执行所述程序代码时用于实现如下步骤:获取针对目标对象的预测样本和所述预测样本对应的观测样本;基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标;根据所述多个预测误差指标对所述目标对象的预测效果进行评估。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的绝对百分比误差,其中,预测值和观测值均为0的第一预测时间段内的所述绝对百分比误差为第一设定值;根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:对于预测值和观测值不全为0的第二预测时间段,计算所述第二预测时间段内的预测值与观测值的差值,并计算所述第二预测时间段内的预测值与观测值的和值;计算所述第二预测时间段内的所述差值与所述和值之间的比值,将所述比值与第二设定值的乘积的绝对值作为所述第二预测时间段内的所述绝对百分比误差。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差;根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:计算所述各个预测时间段内的预测值与观测值的差值,并计算所述各个预测时间段内的所述差值与观测值之间的比值的绝对值;计算所述各个预测时间段内的所述绝对值的反正切值,以作为所述各个时间段内的所述反正切绝对百分比误差。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对比例误差;根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
在本发明的一些实施例中,基于前述方案,所述各个预测时间段内的预测值与观测值的反正切绝对比例误差为arctan(qt),其中,
xt表示预测时间段t内的预测值;yt表示预测时间段t内的观测值;n表示预测时间段的个数且n≥2。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:计算所述各个预测时间段内的所述反正切绝对比例误差与第三设定值的乘积;计算所述各个预测时间段对应的所述乘积的均值,将所述均值作为所述平均反正切绝对比例误差。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:对所述观测样本进行多项式平滑处理,得到所述观测样本对应的拟合样本;根据所述预测样本和所述观测样本对应的拟合样本,计算所述多个预测误差指标。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:将所述观测样本分为m段样本;根据所述m段样本,生成子样本;对所述子样本进行多项式回归处理,得到每个所述子样本对应的多项式;基于每个所述子样本对应的多项式生成所述观测样本对应的拟合样本。
在本发明的一些实施例中,基于前述方案,根据以下公式生成所述子样本:
Yi={y(i-1)b+1,y(i-1)b+2,…,y(i-1)b+b}
其中,Yi表示第i个子样本;y(i-1)b+b表示预测时间段(i-1)b+b内的观测值;b表示所述m段样本中每段样本的长度。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:基于每个所述子样本对应的多项式生成每个所述子样本对应的拟合样本;根据每个所述子样本对应的拟合样本,生成所述观测样本对应的拟合样本。
在本发明的一些实施例中,基于前述方案,根据以下公式生成每个所述子样本对应的拟合样本:
Fi={pi,k((i-1)b+1),pi,k((i-1)b+2),…,pi,k((i-1)b+b)}
其中,Fi表示第i个子样本对应的拟合样本;pi,k()表示通过k阶多项式对第i个子样本进行多项式回归处理得到的多项式;1≤k≤b+1。
在本发明的一些实施例中,基于前述方案,通过以下公式生成所述观测样本对应的拟合样本:
F=F1∪F2∪…Fm∪Ytail
其中,F表示所述观测样本对应的拟合样本;n表示所述观测样本的总长度。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的绝对百分比误差,其中,预测值和所述拟合值均为0的第三预测时间段内的所述绝对百分比误差为第四设定值;根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对百分比误差;根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个所述预测误差指标。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对比例误差;根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:基于各个所述对象的预测样本和观测样本,分别计算各个所述对象的所述多个预测误差指标;基于各个所述对象的所述多个预测误差指标,分别计算所述多个对象整体的多个预测误差指标。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:基于所述观测样本对应的第一预测样本和第二预测样本,计算所述第一预测样本和所述第二预测样本分别对应的多个预测误差指标;根据所述多个预测误差指标对所述目标对象的预测结果进行评估,包括:若所述第一预测样本对应的多个预测误差指标中有预定数量个预测误差指标大于所述第二预测样本对应的预测误差指标且误差指标的差值大于或等于阈值,则确定所述第二预测样本的预测效果优于所述第一预测样本的预测效果。
在本发明的一些实施例中,基于前述方案,所述预定数量大于所述多个预测误差指标的数量的一半。
在本发明的一些实施例中,基于前述方案,多个预测误差指标的数量为奇数个。
需要说明的是:上述的介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于:电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
示例性装置
在介绍了本发明示例性实施方式的介质之后,接下来,参考图7对本发明示例性实施方式的预测处理装置进行说明。
图7示意性示出了根据本发明的一个实施例的预测处理装置的框图。
参照图7所示,根据本发明的一个实施例的预测处理装置700,包括:获取单元701、处理单元702和评估单元703。
其中,获取单元701用于获取针对目标对象的预测样本和所述预测样本对应的观测样本;处理单元702用于基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标;评估单元703用于根据所述多个预测误差指标对所述目标对象的预测效果进行评估。
在本发明的一个实施例中,处理单元702包括:第一计算单元7021,用于根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的绝对百分比误差,其中,预测值和观测值均为0的第一预测时间段内的所述绝对百分比误差为第一设定值;第二计算单元7022,用于根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
在本发明的一个实施例中,第一计算单元7021配置为:对于预测值和观测值不全为0的第二预测时间段,计算所述第二预测时间段内的预测值与观测值的差值,并计算所述第二预测时间段内的预测值与观测值的和值;计算所述第二预测时间段内的所述差值与所述和值之间的比值,将所述比值与第二设定值的乘积的绝对值作为所述第二预测时间段内的所述绝对百分比误差。
在本发明的一个实施例中,处理单元702包括:第三计算单元7023,用于根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差;第四计算单元7024,用于根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个所述预测误差指标。
在本发明的一个实施例中,第三计算单元7023配置为:计算所述各个预测时间段内的预测值与观测值的差值,并计算所述各个预测时间段内的所述差值与观测值之间的比值的绝对值;计算所述各个预测时间段内的所述绝对值的反正切值,以作为所述各个时间段内的所述反正切绝对百分比误差。
在本发明的一个实施例中,计算单元702包括:第五计算单元7025,用于根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对比例误差;第六计算单元7026,用于根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
在本发明的一个实施例中,所述各个预测时间段内的预测值与观测值的反正切绝对比例误差为arctan(qt),其中,
xt表示预测时间段t内的预测值;yt表示预测时间段t内的观测值;n表示预测时间段的个数且n≥2。
在本发明的一个实施例中,第六计算单元7026配置为:计算所述各个预测时间段内的所述反正切绝对比例误差与第三设定值的乘积;计算所述各个预测时间段对应的所述乘积的均值,将所述均值作为所述平均反正切绝对比例误差。
在本发明的一个实施例中,处理单元702包括:平滑单元7027,用于对所述观测样本进行多项式平滑处理,得到所述观测样本对应的拟合样本;执行单元7028,用于根据所述预测样本和所述观测样本对应的拟合样本,计算所述多个预测误差指标。
在本发明的一个实施例中,平滑单元7027配置为:将所述观测样本分为m段样本;根据所述m段样本,生成子样本;对所述子样本进行多项式回归处理,得到每个所述子样本对应的多项式;基于每个所述子样本对应的多项式生成所述观测样本对应的拟合样本。
在本发明的一个实施例中,根据以下公式生成所述子样本:
Yi={y(i-1)b+1,y(i-1)b+2,…,y(i-1)b+b}
其中,Yi表示第i个子样本;y(i-1)b+b表示预测时间段(i-1)b+b内的观测值;b表示所述m段样本中每段样本的长度。
在本发明的一个实施例中,平滑单元7027配置为:基于每个所述子样本对应的多项式生成每个所述子样本对应的拟合样本;根据每个所述子样本对应的拟合样本,生成所述观测样本对应的拟合样本。
在本发明的一个实施例中,根据以下公式生成每个所述子样本对应的拟合样本:
Fi={pi,k((i-1)b+1),pi,k((i-1)b+2),…,pi,k((i-1)b+b)}
其中,Fi表示第i个子样本对应的拟合样本;pi,k()表示通过k阶多项式对第i个子样本进行多项式回归处理得到的多项式;1≤k≤b+1。
在本发明的一个实施例中,通过以下公式生成所述观测样本对应的拟合样本:
F=F1∪F2∪…Fm∪Ytail
其中,F表示所述观测样本对应的拟合样本;n表示所述观测样本的总长度。
在本发明的一个实施例中,执行单元7028配置为:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的绝对百分比误差,其中,预测值和所述拟合值均为0的第三预测时间段内的所述绝对百分比误差为第四设定值;根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
在本发明的一个实施例中,执行单元7028配置为:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对百分比误差;根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个所述预测误差指标。
在本发明的一个实施例中,执行单元7028配置为:根据所述预测样本和所述观测样本对应的拟合样本,计算各个预测时间段内的预测值与观测值对应的拟合值的反正切绝对比例误差;根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
在本发明的一个实施例中,所述目标对象包括多个对象;所述处理单元702配置为:基于各个所述对象的预测样本和观测样本,分别计算各个所述对象的所述多个预测误差指标;基于各个所述对象的所述多个预测误差指标,分别计算所述多个对象整体的多个预测误差指标。
在本发明的一个实施例中,处理单元702配置为:基于所述观测样本对应的第一预测样本和第二预测样本,计算所述第一预测样本和所述第二预测样本分别对应的多个预测误差指标;所述评估单元703配置为:若所述第一预测样本对应的多个预测误差指标中有预定数量个预测误差指标大于所述第二预测样本对应的预测误差指标且误差指标的差值大于或等于阈值,则确定所述第二预测样本的预测效果优于所述第一预测样本的预测效果。
在本发明的一个实施例中,所述预定数量大于所述多个预测误差指标的数量的一半。
在本发明的一个实施例中,多个预测误差指标的数量为奇数个。
示例性计算设备
在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来,介绍根据本发明的另一示例性实施方式的计算设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明实施方式的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的预测处理方法中的步骤。例如,所述处理器可以执行如图1中所示的步骤S110,获取针对目标对象的预测样本和所述预测样本对应的观测样本;步骤S120,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标;步骤S130,根据所述多个预测误差指标对所述目标对象的预测效果进行评估。又如,所述处理器也可以执行如图2至图6中所示的步骤。
应当注意,尽管在上文详细描述中提及了预测处理装置的若干单元或子单元,但是这种划分仅仅是示例性的,并非是强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或单元的特征和功能可以在一个模块或单元中具体化。反之,上文描述的一个模块或单元的特征和功能可以进一步划分为由多个模块或单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所发明的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种预测处理方法,包括:
获取针对目标对象的预测样本和所述预测样本对应的观测样本;
基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标;
根据所述多个预测误差指标对所述目标对象的预测效果进行评估。
2.根据权利要求1所述的方法,其中,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标,包括:
根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的绝对百分比误差,其中,预测值和观测值均为0的第一预测时间段内的所述绝对百分比误差为第一设定值;
根据所述各个预测时间段内的所述绝对百分比误差,计算所有预测时间段的平均绝对百分比误差,将所述平均绝对百分比误差作为一个所述预测误差指标。
3.根据权利要求2所述的方法,其中,计算各个预测时间段内的预测值与观测值的绝对百分比误差,包括:
对于预测值和观测值不全为0的第二预测时间段,计算所述第二预测时间段内的预测值与观测值的差值,并计算所述第二预测时间段内的预测值与观测值的和值;
计算所述第二预测时间段内的所述差值与所述和值之间的比值,将所述比值与第二设定值的乘积的绝对值作为所述第二预测时间段内的所述绝对百分比误差。
4.根据权利要求1所述的方法,其中,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果多个预测误差指标,包括:
根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差;
根据所述各个预测时间段内的所述反正切绝对百分比误差,计算所有预测时间段的平均反正切绝对百分比误差,将所述平均反正切绝对百分比误差作为一个所述预测误差指标。
5.根据权利要求4所述的方法,其中,计算各个预测时间段内的预测值与观测值的反正切绝对百分比误差,包括:
计算所述各个预测时间段内的预测值与观测值的差值,并计算所述各个预测时间段内的所述差值与观测值之间的比值的绝对值;
计算所述各个预测时间段内的所述绝对值的反正切值,以作为所述各个时间段内的所述反正切绝对百分比误差。
6.根据权利要求1所述的方法,其中,基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标,包括:
根据所述预测样本和所述观测样本,计算各个预测时间段内的预测值与观测值的反正切绝对比例误差;
根据所述各个预测时间段内的所述反正切绝对比例误差,计算所有预测时间段的平均反正切绝对比例误差,将所述平均反正切绝对比例误差作为一个所述预测误差指标。
7.根据权利要求6所述的方法,所述各个预测时间段内的预测值与观测值的反正切绝对比例误差为arctan(qt),其中,
xt表示预测时间段t内的预测值;yt表示预测时间段t内的观测值;n表示预测时间段的个数且n≥2。
8.一种介质,其上存储有程序,该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
9.一种预测处理装置,包括:
获取单元,用于获取针对目标对象的预测样本和所述预测样本对应的观测样本;
处理单元,用于基于所述预测样本和所述观测样本,计算针对所述目标对象的预测效果的多个预测误差指标;
评估单元,用于根据所述多个预测误差指标对所述目标对象的预测效果进行评估。
10.一种计算设备,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至7中任一项所述的方法。
CN201811013063.5A 2018-08-31 2018-08-31 预测处理方法、介质、装置和计算设备 Pending CN109284861A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811013063.5A CN109284861A (zh) 2018-08-31 2018-08-31 预测处理方法、介质、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811013063.5A CN109284861A (zh) 2018-08-31 2018-08-31 预测处理方法、介质、装置和计算设备

Publications (1)

Publication Number Publication Date
CN109284861A true CN109284861A (zh) 2019-01-29

Family

ID=65183927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811013063.5A Pending CN109284861A (zh) 2018-08-31 2018-08-31 预测处理方法、介质、装置和计算设备

Country Status (1)

Country Link
CN (1) CN109284861A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815487A (zh) * 2020-06-28 2020-10-23 珠海中科先进技术研究院有限公司 基于深度学习的健康教育评估方法、装置及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815487A (zh) * 2020-06-28 2020-10-23 珠海中科先进技术研究院有限公司 基于深度学习的健康教育评估方法、装置及介质
CN111815487B (zh) * 2020-06-28 2024-02-27 珠海中科先进技术研究院有限公司 基于深度学习的健康教育评估方法、装置及介质

Similar Documents

Publication Publication Date Title
US8527966B2 (en) Source code inspection method and system
US7599819B2 (en) Method and system for generating a predictive analysis of the performance of peer reviews
US20180337842A1 (en) Method and system for temporal sampling in evolving network
US20210048811A1 (en) Model generation device for life prediction, model generation method for life prediction, and recording medium storing model generation program for life prediction
US20200027119A1 (en) Dynamic promotion analytics
JP7010674B2 (ja) 電力需要予測装置、電力需要予測方法およびプログラム
CN109272348B (zh) 活跃用户数量确定方法及装置、存储介质和电子设备
US20230039523A1 (en) Model update device and method and process control system
KR20210031627A (ko) 기계 학습 모델 훈련 방법 및 시스템
Gulay et al. Comparison of forecasting performances: Does normalization and variance stabilization method beat GARCH (1, 1)‐type models? Empirical Evidence from the Stock Markets
Hoga et al. Monitoring value-at-risk and expected shortfall forecasts
Wang et al. Noise content assessment in GNSS coordinate time-series with autoregressive and heteroscedastic random errors
CN110490132B (zh) 数据处理方法和装置
CN109284861A (zh) 预测处理方法、介质、装置和计算设备
CN116128135A (zh) 数据处理方法及装置、电子设备和存储介质
US9188968B2 (en) Run-time characterization of on-demand analytical model accuracy
CN108897673B (zh) 系统容量评估方法与装置
CN113822693A (zh) 用户购买力评价值的生成方法、装置、设备及存储介质
CN112785023B (zh) 物品重量测量方法及装置、电子设备、存储介质
JP5636922B2 (ja) 性能予測装置、性能予測方法およびプログラム
Creal Analysis of filtering and smoothing algorithms for Lévy-driven stochastic volatility models
JP4956380B2 (ja) 通信帯域算出装置、方法、およびプログラム
CN113792931B (zh) 数据预测方法、装置、物流货量预测方法、介质和设备
JP2004110300A (ja) データ予測方法、データ予測装置、コンピュータプログラム、及び記録媒体
CN112418534B (zh) 揽件量预测方法及装置、电子设备、计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190129