WO2021204176A1

WO2021204176A1 - 业务数据预测方法、装置、电子设备及计算机可读存储介质

Info

Publication number: WO2021204176A1
Application number: PCT/CN2021/085880
Authority: WO
Inventors: 郝吉芳; 赵钧陶
Original assignee: 京东方科技集团股份有限公司
Priority date: 2020-04-09
Filing date: 2021-04-08
Publication date: 2021-10-14
Also published as: CN111523084A

Abstract

业务数据预测方法、装置、电子设备及计算机可读存储介质，涉及数据处理技术领域。该方法包括：获取与指定时段对应的历史同期的历史业务数据；根据历史业务数据，确定预测模型对应的初始模型参数；调用预测模型根据初始模型参数和历史业务数据，预测得到指定时段对应的第一预测结果和预测残差值，根据预测残差值确定预测模型对应的目标模型参数；调用预测模型根据目标模型参数和历史业务数据，对预测残差值进行处理，得到指定时段对应的第二预测结果；根据第一预测结果和第二预测结果，确定指定时段对应的预测数据。

Description

业务数据预测方法、装置、电子设备及计算机可读存储介质

相关申请的交叉引用

本公开要求在2020年04月09日提交中国专利局、申请号为202010276366.7、名称为“业务数据预测方法、装置、电子设备及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及数据处理技术领域，特别是涉及一种业务数据预测方法、装置、电子设备及计算机可读存储介质。

背景技术

数据预测分析是利用历史的数据对未来的数据和趋势进行预测的方法，在现代科技发展和生产力提高中有广泛的应用。

差分整合移动平均自回归模型(Autoregressive Integrated Moving Average model，ARIMA模型)，又称整合移动平均自回归模型(移动也可称作滑动)，是当前的时间序列预测分析方法之一，在预测场景有广泛的应用。在ARIMA模型的表示方式ARIMA(p，d，q)中，AR是“自回归”，p为自回归项数；MA为“滑动平均”，q为滑动平均项数，d为使之成为平稳序列所做的差分次数(阶数)。ARIMA模型的特点是不直接考虑其他相关随机变量的变化。

概述

本公开提供了一种业务数据预测方法、装置、电子设备及计算机可读存储介质。

本公开提供了一种业务数据预测方法，包括：

获取与指定时段对应的历史同期的历史业务数据；

根据所述历史业务数据，确定预测模型对应的初始模型参数；

调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值；

根据所述预测残差值，确定所述预测模型对应的目标模型参数；

调用所述预测模型根据所述目标模型参数和所述历史业务数据，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果；

根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据。

可选地，所述业务数据为企业用户负荷。

可选地，所述获取与所述指定时段对应的历史同期的历史业务数据，包括：

获取所述历史同期的初始历史业务数据；

对所述初始历史业务数据进行筛选，得到所述历史业务数据。

可选地，所述对所述初始历史业务数据进行筛选，得到所述历史业务数据，包括：

计算所述初始历史业务数据对应的平均值和标准差；

计算所述初始历史业务数据与平均值的差值，在所述差值大于预设阈值的情况下，剔除所述差值对应的初始历史业务数据，得到所述历史业务数据。

可选地，所述预设阈值为所述标准差与预设倍数的乘积值。

可选地，所述根据所述历史业务数据，确定预测模型对应的初始模型参数，包括：

对所述历史业务数据进行差分处理，得到所述预测模型对应的第一模型参数；

对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数。

可选地，所述对所述历史业务数据进行差分处理，得到所述预测模型对应的第一模型参数，包括：

确定所述历史业务数据的数据平稳性；

在所述历史业务数据为平稳性数据的情况下，确定所述第一模型参数为0；

在所述历史业务数据为非平稳性数据的情况下，对所述历史业务数据进行n阶差分处理；其中，n为大于等于1的正整数；

在进行所述n阶差分处理后的历史业务数据为平稳性数据的情况下，将所述n作为所述第一模型参数。

可选地，所述确定所述历史业务数据的数据平稳性，包括：

调用所述历史业务数据的时序图，在所述历史业务数据在时间序列上围绕一个常数值随机波动，且波动范围小于预设范围的情况下，则确定所述历史业务数据为平稳序列。

可选地，所述确定所述历史业务数据的数据平稳性，包括：

调用单位根检验模型对所述历史业务数据进行平稳性检验，在检验统计量对应的概率值小于0.05的情况下，确定所述历史业务数据为平稳序列。

可选地，所述对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数，包括：

根据自相关函数和偏自相关函数，得到所述第二模型参数和所述第三模型参数。

根据信息准则进行定阶处理，得到所述第二模型参数和所述第三模型参数。

可选地，所述历史同期包括第一历史同期和第二历史同期，所述第一历史同期的时间早于所述第二历史同期，所述调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值，包括：

调用所述预测模型根据所述初始模型参数和所述第一历史同期的第一历史业务数据对所述第二历史同期的业务数据进行预测，得到所述第二历史同期的预测业务数据；

根据所述预测业务数据和所述第二历史同期的第二历史业务数据，计算得到所述预测残差值；

调用所述预测模型根据所述初始模型参数、所述第一历史业务数据和所述第二历史业务数据对所述指定时段内的业务数据进行预测，得到所述第一预测结果。

可选地，根据所述预测业务数据和所述第二历史同期的第二历史业务数据，计算得到所述预测残差值，包括：

计算所述第二历史业务数据与对应的所述预测业务数据的差值，将所述差值确定为所述预测残差值。

可选地，所述根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据，包括：

获取所述第一预测结果和所述第二预测结果之间的和值，并将所述和值作为所述指定时段的预测数据。

本公开提供了一种业务数据预测装置，包括：

历史数据获取模块，用于获取与指定时段对应的历史同期的历史业务数据；

模型参数确定模块，用于根据所述历史业务数据，确定预测模型对应的初始模型参数；

第一结果预测模块，用于调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值；

目标参数确定模块，用于根据所述预测残差值，确定所述预测模型对应的目标模型参数；

第二结果预测模块，用于调用所述预测模型根据所述目标模型参数和所述历史业务数据，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果；

预测数据确定模块，用于根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据。

可选地，所述历史数据获取模块包括：

初始业务数据获取单元，用于获取所述历史同期的初始历史业务数据；

历史业务数据筛选单元，用于对所述初始历史业务数据进行筛选，得到所述历史业务数据。

可选地，所述模型参数确定模块包括：

第一模型参数获取单元，用于对所述历史业务数据进行差分处理，得到所述预测模型对应的第一模型参数；

第二模型参数获取单元，用于对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数。

可选地，所述历史同期包括第一历史同期和第二历史同期，所述第一历史同期的时间早于所述第二历史同期，所述第一结果预测模块包括：

预测业务数据获取单元，用于调用所述预测模型根据所述初始模型参数和所述第一历史同期的第一历史业务数据对所述第二历史同期的业务数据进行预测，得到所述第二历史同期的预测业务数据；

预测残差值计算单元，用于根据所述预测业务数据和所述第二历史同期的第二历史业务数据，计算得到所述预测残差值；

第一预测结果获取单元，用于调用所述预测模型根据所述初始模型参数、所述第一历史业务数据和所述第二历史业务数据对所述指定时段内的业务数据进行预测，得到所述第一预测结果。

本公开提供了一种电子设备，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一项所述的业务数据预测方法。

本公开提供了一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一项所述的业务数据预测方法。

本公开提供了一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备上运行时，导致所述电子设备执行上述的业务数据预测方法。

上述说明仅是本公开技术方案的概述，为了能够更清楚了解本公开的技术手段，而可依照说明书的内容予以实施，并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂，以下特举本公开的具体实施方式。

附图简述

为了更清楚地说明本公开实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本公开实施例提供的一种业务数据预测方法的步骤流程图；

图2示出了本公开实施例提供的另一种业务数据预测方法的步骤流程图；

图3示出了本公开实施例提供的一种检验数据平稳性的时序图；

图4示出了本公开实施例提供的一种自相关函数的示意图；

图5示出了本公开实施例提供的一种偏自相关函数的示意图；

图6示出了本公开实施例提供的一种预测值和真实值的示意图；

图7示出了本公开实施例提供的一种业务数据预测装置的结构示意图；

图8示出了本公开实施例提供的另一种业务数据预测装置的结构示意图；

图9示意性地示出了用于执行根据本公开的方法的电子设备的框图；并且

图10示意性地示出了用于保持或者携带实现根据本公开的方法的程序代码的存储单元。

详细描述

为使本公开的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本公开作进一步详细的说明。

参照图1，示出了本公开实施例提供的一种业务数据预测方法的步骤流程图，该业务数据预测方法具体可以包括如下步骤：

步骤101：获取与指定时段对应的历史同期的历史业务数据。

本公开实施例可以应用于采用ARIMA模型对未来某个时段内的业务数据进行预测的场景中。

业务数据可以为股价、房价、销售额、访问量、国内生产总值(Gross Domestic Product，GDP)、企业用户负荷、气温等数据，业务数据可以为上述的一者或多者。具体地，可以根据业务需求而定，本实施例对此不加以限制。其中，企业用户负荷可以为企业承担的用电、用水、用资源等负荷。

ARIMA(p，d，q)中，AR是“自回归”，p为自回归项数；MA为“滑动平均”，q为滑动平均项数，d为使之成为平稳序列所做的差分次数(阶数)。对于ARIMA模型进行如下描述：

1、AR自回归模型

模型需要确定阶数p，表示用几期的历史值预测当前值，模型公式为：

上述公式(1)中，y _t为当前值，u是常数，p是阶数，ε _t是误差值。

2、移动平均MA

移动平均模型关注的是自回归模型中的误差项的累加，q阶自回归过程的公式为：

上述公式(2)中，y _t为当前值，u是常数，q是阶数，θ _i是误差系数，ε _t是误差。

3、自回归移动平均模型ARMA

自回归模型AR和移动平均模型MA模型结合，就可以得到自回归移动平均模型ARMA(p，q)，计算公式如下：

4、差分的阶数d

数据平稳性处理时的差分阶数，即非平稳数据经过几阶差分后是平稳的。

5、差分自回归移动平均模型ARIMA

将自回归模型、移动平均模型和差分法结合，就可以得到差分自回归移动平均模型ARIMA(p，d，q)，其中d是需要对数据进行差分的阶数。

可以理解地，上述仅是为了理解差分自回归移动平均模型而列举的方案。

指定时段是指未来某个需要进行业务数据预测的时段，如预测明天全天的股价，则将明天全天作为指定时段，或明天9:00～12:00之间的用电量，则将明天9:00～12:00作为指定时段等等。

历史业务数据是指与指定时段属于同期的历史数据，即历史同期的业务数据，例如，在需要对明天9:00～12:00之间的用电量，则将明天9:00～12:00作为指定时段，历史同期可以为昨天9:00～12:00，前天9:00～12:00等等。

在需要对未来的指定时段内的业务数据进行预测时，可以获取与指定时段对应的历史同期的历史业务数据，具体地，可以根据预先保存历史业务数据库，从数据库中筛选出与指定时段处于历史同期的业务数据，以作为历史业务数据。

当然，在本实施例中，还可以采用其它方式获取与指定时段对应的历史同期的历史业务数据，本实施例对此不加以限制。

在获取与指定时段对应的历史同期的历史业务数据之后，执行步骤102。

步骤102：根据所述历史业务数据，确定预测模型对应的初始模型参数。

预测模型是指用于对未来的业务数据进行预测的模型，在本实施例中，预测模型优选为ARIMA模型，在后续示例中，以ARIMA模型对本实施例进行描述。

初始模型参数是指运行预测模型所需的参数，例如，在运行ARIMA模型时，所必须的参数为d、p、q(即上述步骤101中所述的参数)。本实施例中，采用二阶预测的方式，初始模型参数即为一阶预测时，预测模型运行时所需的模型参数。

在获取与指定时段对应的历史同期的历史业务数据之后，则可以根据历史业务数据确定出ARIMA模型对应的初始模型参数，在有了模型参数之后，才可以正常运行ARIMA模型。而对于如何确定初始模型参数的过程将在下述实施例中进行详细描述，本实施例在此不再加以赘述。

在根据历史业务数据确定出预测模型对应的初始模型参数之后，执行步骤103。

步骤103：调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值。

本实施例采用了两阶预测的方式，第一预测结果即为一阶预测所得到的结果。预测残差值是指在对指定时段的预测结果进行预测时所得到的残差值。

在确定出预测模型对应的初始模型参数之后，则可以调用ARIMA模型根据初始模型参数和历史业务数据对指定时段内的业务数据进行预测，以得到第一预测结果和预测残差值，对于具体地预测过程可以在下述实施例中进行详细描述，本实施例在此不再加以赘述。

在调用预测模型根据初始模型参数和历史业务数据预测得到指定时段对应的第一预测结果和预测残差值之后，执行步骤104。

步骤104：根据所述预测残差值，确定所述预测模型对应的目标模型参数。

目标模型参数是指通过一阶预测得到的初始预测残差值，重新对预测模型进行训练而得到的运行预测模型的模型参数。

在调用ARIMA模型对指定时段进行业务数据预测时，产生了初始预测残差值，则可以初始预测残差值重新确定预测模型的模型参数，即目标模型参数。对于该过程类似于确定初始模型参数的过程，本实施例在此不再加以赘述。

在调用预测模型根据初始预测残差值确定出预测模型的目标模型参数之后，进而，执行步骤105。

步骤105：调用所述预测模型根据所述目标模型参数和所述历史业务数据，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果。

第二预测结果是指调用ARIMA模型对一阶预测过程中产生的预测残差值进行二阶预测，所得到的预测结果。

在调用ARIMA模型对指定时段进行业务数据预测时，产生了预测残差值，则可以调用ARIMA根据重新获取的目标模型参数和历史业务数据对预测残差值进行二阶预测，进而，可以得到指定时段对应的第二预测结果。对于该过程将在下述实施例中进行详细描述，本实施例在此不再加以赘述。

在调用预测模型根据目标模型参数和历史业务数据对预测残差值进行处理，以得到指定时段对应的第二预测结果，进而，执行步骤106。

步骤106：根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据。

预测数据是指采用ARIMA模型预测得到的在未来指定时段内的预测业务数据。

在对指定时段进行了二阶预测，得到了相应的第一预测结果和第二预测结果之后，则可以结合第一预测结果和第二预测结果确定出指定时段对应的预测数据，即采用第二预测结果对第一预测结果进行校正，从而得到最终的指定时段内的预测业务数据。

本实施例通过在采用ARIMA模型预测的过程中，采用二次预测的方式，能够使得数据预测的准确率得到大幅提升。

本公开实施例提供的业务数据预测方法，通过在需要对未来的指定时段内的业务数据进行预测时，获取与指定时段对应的历史同期的历史业务数据，根据历史业务数据，确定预测模型对应的初始模型参数，调用预测模型根据初始模型参数和历史业务数据，预测得到指定时段对应的第一预测结果和预测残差值，根据预测残差值确定预测模型对应的目标模型参数，调用预测模型根据目标模型参数和历史业务数据，对预测残差值进行处理，得到指定时段对应的第二预测结果，根据第一预测结果和第二预测结果，确定指定时段对应的预测数据。本公开实施例通过采用二阶段的预测方式，可以提升数据预测的准确率。

参照图2，示出了本公开实施例提供的另一种业务数据预测方法的步骤流程图，该业务数据预测方法具体可以包括如下步骤：

步骤201：获取所述历史同期的初始历史业务数据。

业务数据可以为股价、房价、销售额、访问量、GDP(Gross Domestic Product，国内生产总值)、气温等数据，业务数据可以为上述数据的至少一种。具体地，可以根据业务需求而定，本实施例对此不加以限制。

1、AR自回归模型

2、移动平均MA

3、自回归移动平均模型ARMA

4、差分的阶数d

5、差分自回归移动平均模型ARIMA

短期负荷预测的核心功能是根据企业级用户的历史用电负荷，预测未来短期(15分钟、日)的用电负荷，为售电业务在电力现货交易中进行交易申报、偏差价差收益计算提供参考依据。本实施例以用电负荷作为业务数据进行预测。

历史同期是指与指定时段对应的过往同时段，例如，在需要对明天9:00～12:00之间的用电量，则将明天9:00～12:00作为指定时段，历史同期可以为昨天9:00～12:00，前天9:00～12:00等等。

初始历史业务数据是指获取的历史同期的还未进行筛选的业务数据。

在需要对未来的指定时段内的业务数据进行预测时，可以获取与指定时段对应的历史同期的初始历史业务数据，可以根据预先保存历史业务数据库，从数据库中筛选出与指定时段处于历史同期的业务数据，以作为初始历史业务数据。

当然，在本实施例中，还可以采用其它方式获取与指定时段对应的历史同期的初始历史业务数据，本实施例对此不加以限制。

在获取初始历史业务数据之后，执行步骤202。

步骤202：对所述初始历史业务数据进行筛选，得到所述历史业务数据。

在获取初始历史业务数据之后，则可以对初始历史业务数据进行筛选，以得到历史业务数据，具体地筛选过程可以结合下述具体实现方式进行详细描述。

在本实施例的一种具体实现方式中，上述步骤202可以包括:

子步骤S1：计算所述初始历史业务数据对应的平均值和标准差。

在本实施例中，平均值是指初始历史业务数据的平均值，例如，在初始历史业务数据为10条数据时，则可以将这10条数据相加，然后除以10即得到得到平均值。

标准差又称为均方差，是指初始历史业务数据的标准差，在概率统计中最常使用作为统计分布程度(statistical dispersion)上的测量。标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。

在获取到初始历史业务数据之后，则可以计算初始历史业务数据对应的平均值和标准差，具体的计算过程本实施例不加以详细描述。

在计算得到初始历史业务数据对应的平均值和标准差之后，执行子步骤S2。

子步骤S2：计算所述初始历史业务数据与所述平均值的差值，在所述差值大于预设阈值的情况下，剔除所述差值对应的初始历史业务数据，得到所述历史业务数据。

预设阈值可以为标准差与预设倍数的乘积值，预设倍数是指由业务人员预先设置的用于筛选初始历史业务数据的倍数。在本实施例中，预设倍数优选为3倍。

在计算得到初始历史业务数据对应的平均值和标准差之后，则可以计算初始历史业务数据与平均值之间的差值。然后将差值大于预设倍数的初始历史业务数据剔除，剩余的即为需要进行后续预测的历史业务数据。

在获取历史业务数据之后，执行步骤203，和步骤204。

步骤203：对所述历史业务数据进行差分处理，得到所述预测模型对应的第一模型参数。

第一模型参数是指ARIMA运行所需的参数，在本实施例中，第一模型参数即为上述步骤201中所示的参数d。也即第一模型参数为差分阶数。

在本实施例中，在获取历史业务数据之后，可以对历史业务数据进行差分处理，以得到第一模型参数，具体地，可以结合下述具体实现方式进行详细描述。

在本实施例的一种具体实现方式中，上述步骤203可以包括：

子步骤M1：确定所述历史业务数据的数据平稳性。

在本实施例中，数据平稳性是指历史业务数据是否平稳的特性。

在确定ARIMA模型的第一模型参数之前，先确定历史业务数据的数据平稳性，具体地，可以采用如下两种方式：

1、时序图，如果序列始终在一个常数值附近随机波动，波动范围有界，且没有明显的趋势性或周期性，可认为是平稳序列。如图3所示，左图非平稳，右图为平稳序列。

2、ADF单位根检验，可精确判断平稳性。调用python statsmodels模块tsa.stattools.adfuller函数，如果检验统计量对应的P值小于0.05，则可确认为平稳序列。

当然，在具体实现中，还可以采用其它方式对历史业务数据的平稳性进行检测，具体地，可以根据业务需求而定，本实施例对此不加以限制。

在确定历史业务数据的数据平稳性之后，执行子步骤M2或M3。

子步骤M2：在所述历史业务数据为平稳性数据的情况下，确定所述第一模型参数为0。

在确定历史业务数据为平稳性数据的情况下，无需对历史业务数据进行n阶差分处理，则可以将0作为第一模型参数。

子步骤M3：在所述历史业务数据为非平稳性数据的情况下，对所述历史业务数据进行n阶差分处理；其中，n为大于等于1的正整数。

在确定历史业务数据为非平稳性数据的情况下，则可以对历史业务数据进行n阶差分处理，具体地，在历史业务数据为非平稳性数据时，可以依次对历史业务数据进行一阶差分、二阶差分、三阶差分或取对数后一阶、二阶差分方法处理数据后，检验平稳性，直到得到平稳序列。

子步骤M4：在进行所述n阶差分处理后的历史业务数据为平稳性数据的情况下，将所述n作为所述第一模型参数。

在对历史业务数据进行n阶差分处理，且进行n阶差分处理后的历史业务数据为平卫星数据时，则将n作为第一模型参数，例如，在对历史业务数据进行二阶差分处理之后，得到的历史业务数据为平稳性数据时，则将2作为第一模型参数。

步骤204：对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数。

第二模型参数和第三模型参数即为上述步骤201中所示的p和q，即最佳ARIMA模型的阶次。在本实施例中，在第二模型参数为p时，则第三模型参数即为q；而在第二模型参数为q时，则第三模型参数即为q，具体地，可以根据业务需求而定，本实施例对此不加以限制。

在获取到历史业务数据之后，可以对历史业务数据进行定阶处理，以得到第二模型参数和第三模型参数。具体地，可以采用下述两种方法获取第二模型参数和第三模型参数。

方法一：根据自相关函数和偏自相关函数确定p，q的值。自相关函数ACF描述的是时间序列观测值与其过去的观测值之间的线性相关性。偏自相关函数PACF描述的是在给定中间观测值的条件下，时间序列观测值预期过去的观测值之间的线性相关性。如ACF图(图4所示)和PACF图(如2c所示)。从图中可以看出，自相关系数1阶后截尾，偏自相关系数0阶后截尾，因此p＝0，q＝1。

方法二：信息准则定阶。目前选择模型常用如下准则：(其中L为似然函数，k为参数数量，n为观察数)。

AIC＝-2ln(L)+2k：赤池信息量，akaike information criterion

BIC＝-2ln(L)+ln(n)*k：贝叶斯信息量，bayesian information criterion

HQ＝-2ln(L)+ln(ln(n))*k：hannan-quinn criterion

常用的是AIC准则，同时需要尽量避免出现过拟合的情况。所以优先考虑的模型应是AIC值最小的那一个模型。也可依次尝试每一种准则，选择最优。

调用python statsmodels模块tsa.arma_order_select_ic函数，设置p、q的阶数范围和模型选则准则，得到最佳ARMA模型的阶次p、q。

确定了参数d、p、q后，运用ARIMA模型做预测。如果d不等于0，平稳性处理时采用了差分或对数运算，需要对预测结果逆运算即可得到预测的负荷值。如图6所示，展示出了预测值和真实值的结果，其中，在time为30时处于上方的曲线为真实值对应的曲线，而在time为30时处于下方的曲线即为预测值对应的曲线。

在确定第二模型参数和第三模型参数之后，执行步骤205。

步骤205：调用所述预测模型根据所述初始模型参数和所述第一历史同期的第一历史业务数据对所述第二历史同期的业务数据进行预测，得到所述第二历史同期的预测业务数据。

在本实施例中，历史同期可以包括第一历史同期和第二历史同期，第一历史同期的时间要早于第二历史同期，例如，在指定时段为明天上午9:00～12:00，则第二历史同期可以为昨天上午9:00～12:00，第三历史同期可以为前天上午9:00～12：00。

可以理解地，上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例，不作为对本公开实施例的唯一限制。

第一历史业务数据是指从第一历史同期内获取的业务数据。

第二历史业务数据是指从第二历史同期内获取的业务数据。

第二历史同期的预测业务数据是指对第二历史同期内的业务数据进行预测，而得到的预测业务数据。也即预测的第二历史同期的业务数据。

在获取到ARIMA模型运行所需的初始模型参数之后，可以调用ARIMA模型根据初始模型参数和第一历史同期的第一历史业务数据对第二历史同期的业务数据进行预测，以得到预测业务数据。

步骤206：根据所述预测业务数据和所述第二历史同期的第二历史业务数据，计算得到所述预测残差值。

在预测得到第二历史同期的预测业务数据之后，则可以根据预测业务数据和第二历史同期的第二历史业务数据，以得到预测残差值，具体地，可以根据预测业务数据和真实的第二历史业务数据来计算预测残差值，例如，以预测未来1天的15分钟用电量为例，y ₁,y ₂,...,y _n为真实值，p ₁,p ₂,...,p _n为预测值，则残差序列为r ₁,r ₂,...,r _n，相应的计算公式为：r _i＝y _i-p _i，其中，i＝1，2，...，n，n为正整数。

在根据预测业务数据和第二历史同期的第二历史业务数据计算得到预测残差值之后，执行步骤207。

步骤207：调用所述预测模型根据所述初始模型参数、所述第一历史业务数据和所述第二历史业务数据对所述指定时段内的业务数据进行预测，得到所述第一预测结果。

在获取到初始模型参数(即上述步骤中提及的第一模型参数、第二模型参数和第三模型参数)之后，可以调用ARIMA模型根据模型参数和第一历史业务数据和第二历史业务数据对指定时段内的业务数据进行预测，以得到第一预测结果。

在得到第一预测结果之后，执行步骤208。

步骤208：根据所述预测残差值，确定所述预测模型对应的目标模型参数。

在调用预测模型根据初始预测残差值确定出预测模型的目标模型参数之后，进而，执行步骤209。

步骤209：调用所述预测模型根据所述目标模型参数和所述历史业务数据，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果。

在调用ARIMA模型对指定时段进行业务数据预测时，产生了预测残差值，则可以调用ARIMA根据重新确定的目标模型参数和历史业务数据对预测残差值进行二阶预测，进而，可以得到指定时段对应的第二预测结果。承接上述步骤206中的示例，可以对得到的残差序列进行预测，以得到第二预测结果。具体地预测方式可以为：如果d不等于0，平稳性处理时采用了差分或对数运算，需要对预测结果逆运算即可得到预测的负荷值。

在本实施例中，第二预测结果即为第一预测结果的校正参数，即用第二预测结果对第一预测结果进行校正，从而得到所需的预测业务数据。

在得到第二预测结果之后，执行步骤210。

步骤210：获取所述第一预测结果和所述第二预测结果之间的和值，并将所述和值作为所述指定时段的预测数据。

在得到第一预测结果和第二预测结果之后，可以将第一预测结果和第二预测结果相加，从而，能够得到指定时段的预测数据。

在本实施例中，通过采用二阶段预测的方式，可以达到提升预测数据的准确度的有益效果。

参照图7，示出了本公开实施例提供的一种业务数据预测装置的结构示意图，该业务数据预测装置具体可以包括如下模块：

历史数据获取模块310，用于获取与指定时段对应的历史同期的历史业务数据；

模型参数确定模块320，用于根据所述历史业务数据，确定预测模型对应的初始模型参数；

第一结果预测模块330，用于调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值；

目标参数确定模块340，用于根据所述预测残差值，确定所述预测模型对应的目标模型参数；

第二结果预测模块350，用于调用所述目标预测模型根据所述模型参数和所述历史业务数据，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果；

预测数据确定模块360，用于根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据。

本公开实施例提供的业务数据预测装置，通过在需要对未来的指定时段内的业务数据进行预测时，获取与指定时段对应的历史同期的历史业务数据，根据历史业务数据，确定预测模型对应的初始模型参数，调用预测模型根据初始模型参数和历史业务数据，预测得到指定时段对应的第一预测结果和预测残差值，根据预测残差值确定预测模型对应的目标模型参数，调用预测模型根据目标模型参数和历史业务数据，对预测残差值进行处理，得到指定时段对应的第二预测结果，根据第一预测结果和第二预测结果，确定指定时段对应的预测数据。本公开实施例通过采用二阶段的预测方式，可以提升数据预测的准确率。

参照图8，示出了本公开实施例提供的另一种业务数据预测装置的结构示意图，该业务数据预测装置具体可以包括如下模块：

历史数据获取模块410，用于获取与指定时段对应的历史同期的历史业务数据；

模型参数确定模块420，用于根据所述历史业务数据，确定预测模型对应的初始模型参数；

第一结果预测模块430，用于调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值；

目标参数确定模型440，用于根据所述预测残差值，确定所述预测模型对应的目标模型参数；

第二结果预测模块450，用于调用所述预测模型根据所述目标模型参数和所述历史业务数据，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果；

预测数据确定模块460，用于根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据。

可选地，所述业务数据为企业用户负荷，所述历史数据获取模块410包括：

历史负荷获取单元，用于在需要对未来指定时段内的企业用户负荷进行预测时，获取所述指定时段对应的历史同期的历史企业用户负荷；

所述模型参数确定模块420包括：

初始参数确定单元，用于根据所述历史企业用户负荷，确定所述预测模型对应的初始模型参数；

所述第一结果预测模块430包括：

第一结果预测单元，用于调用所述预测模型根据所述初始模型参数和所述历史企业用户负荷，预测得到所述指定时段对应的第一预测结果和预测残差值；

所述第二结果预测模块450包括：

第二结果获取单元，用于调用所述预测模型根据所述目标模型参数和所述历史企业用户负荷，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果；

所述预测数据确定模块460包括：

预测负荷确定单元，用于根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测企业用户负荷。

可选地，所述历史数据获取模块410包括：

初始业务数据获取单元411，用于获取所述历史同期的初始历史业务数据；

历史业务数据筛选单元412，用于对所述初始历史业务数据进行筛选，得到所述历史业务数据。

可选地，所述历史业务数据筛选单元412包括：

标准差计算子单元，用于计算所述初始历史业务数据对应的平均值和标准差；

历史数据获取子单元，用于计算所述初始历史业务数据与所述平均值的差值，在所述差值大于预设阈值的情况下，剔除所述差值对应的初始历史业务数据，得到所述历史业务数据。

可选地，所述模型参数确定模块420包括：

第一模型参数获取单元421，用于对所述历史业务数据进行差分处理，得到所述预测模型对应的第一模型参数；

第二模型参数获取单元422，用于对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数。

可选地，所述第一模型参数获取单元421包括：

数据平稳性确定子单元，用于确定所述历史业务数据的数据平稳性；

模型参数确定子单元，用于在所述历史业务数据为平稳性数据的情况下，确定所述第一模型参数为0；

数据差分处理子单元，用于在所述历史业务数据为非平稳性数据的情况下，对所述历史业务数据进行n阶差分处理；其中，n为大于等于1的正整数；

第一参数获取子单元，用于在进行所述n阶差分处理后的历史业务数据为平稳性数据的情况下，将所述n作为所述第一模型参数。

可选地，所述历史同期包括第一历史同期和第二历史同期，所述第一历史同期的时间早于所述第二历史同期，所述第一结果预测模块430包括：

预测业务数据获取单元431，用于调用所述预测模型根据所述初始模型参数和所述第一历史同期的第一历史业务数据对所述第二历史同期的业务数据进行预测，得到所述第二历史同期的预测业务数据；

预测残差值计算单元432，用于根据所述预测业务数据和所述第二历史同期的第二历史业务数据，计算得到所述预测残差值；

第一预测结果获取单元433，用于调用所述预测模型根据所述初始模型参数、所述第一历史业务数据和所述第二历史业务数据对所述指定时段内的业务数据进行预测，得到所述第一预测结果。

可选地，所述预测数据确定模块460包括：

预测数据获取单元461，用于获取所述第一预测结果和所述第二预测结果之间的和值，并将所述和值作为所述指定时段的预测数据。

对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本公开所必须的。

另外地，本公开实施例还提供了一种电子设备，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一项所述的业务数据预测方法。

本公开实施例还提供了一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一项所述的业务数据预测方法。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

本公开的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的电子设备中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

例如，图9示出了可以实现根据本公开的方法的电子设备。该电子设备传统上包括处理器1010和以存储器1020形式的计算机程序产品或者计算机可读介质。存储器1020可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器1020具有用于执行上述方法中的任何方法步骤的程序代码1031的存储空间1030。例如，用于程序代码的存储空间1030可以包括分别用于实现上面的方法中的各种步骤的各个程序代码1031。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为如参考图10所述的便携式或者固定存储单元。该存储单元可以具有与图9的电子设备中的存储器1020类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括计算机可读代码1031’，即可以由例如诸如1010之类的处理器读取的代码，这些代码当由电子设备运行时，导致该电子设备执行上面所描述的方法中的各个步骤。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上对本公开所提供的一种业务数据预测方法、一种业务数据预测装置、一种电子设备和一种计算机可读存储介质，进行了详细介绍，本文中应用了具体个例对本公开的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本公开的方法及其核心思想；同时，对于本领域的一般技术人员，依据本公开的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本公开的限制。

Claims

一种业务数据预测方法，包括：

获取与指定时段对应的历史同期的历史业务数据；

根据所述历史业务数据，确定预测模型对应的初始模型参数；

调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值；

根据所述预测残差值，确定所述预测模型对应的目标模型参数；

调用所述预测模型根据所述目标模型参数和所述历史业务数据，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果；

根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据。
根据权利要求1所述的方法，其中，所述业务数据为企业用户负荷。
根据权利要求1或2所述的方法，其中，所述获取与所述指定时段对应的历史同期的历史业务数据，包括：

获取所述历史同期的初始历史业务数据；

对所述初始历史业务数据进行筛选，得到所述历史业务数据。
根据权利要求3所述的方法，其中，所述对所述初始历史业务数据进行筛选，得到所述历史业务数据，包括：

计算所述初始历史业务数据对应的平均值和标准差；

计算所述初始历史业务数据与所述平均值的差值，在所述差值大于预设阈值的情况下，剔除所述差值对应的初始历史业务数据，得到所述历史业务数据。
根据权利要求4所述的方法，其中，所述预设阈值为所述标准差与预设倍数的乘积值。
根据权利要求1或2所述的方法，其中，所述根据所述历史业务数据，确定预测模型对应的初始模型参数，包括：

对所述历史业务数据进行差分处理，得到所述预测模型对应的第一模型参数；

对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数。
根据权利要求6所述的方法，其中，所述对所述历史业务数据进行差分处理，得到所述预测模型对应的第一模型参数，包括：

确定所述历史业务数据的数据平稳性；

在所述历史业务数据为平稳性数据的情况下，确定所述第一模型参数为0；

在所述历史业务数据为非平稳性数据的情况下，对所述历史业务数据进行n阶差分处理；其中，n为大于等于1的正整数；

在进行所述n阶差分处理后的历史业务数据为平稳性数据的情况下，将所述n作为所述第一模型参数。
根据权利要求7所述的方法，其中，所述确定所述历史业务数据的数据平稳性，包括：

调用所述历史业务数据的时序图，在所述历史业务数据在时间序列上围绕一个常数值随机波动，且波动范围小于预设范围的情况下，则确定所述历史业务数据为平稳序列。
根据权利要求7所述的方法，其中，所述确定所述历史业务数据的数据平稳性，包括：

调用单位根检验模型对所述历史业务数据进行平稳性检验，在检验统计量对应的概率值小于0.05的情况下，确定所述历史业务数据为平稳序列。
根据权利要求6所述的方法，其中，所述对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数，包括：

根据自相关函数和偏自相关函数，得到所述第二模型参数和所述第三模型参数。
根据权利要求6所述的方法，其中，所述对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数，包括：

根据信息准则进行定阶处理，得到所述第二模型参数和所述第三模型参数。
根据权利要求1或2所述的方法，其中，所述历史同期包括第一历史同期和第二历史同期，所述第一历史同期的时间早于所述第二历史同期，所述调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值，包括：

调用所述预测模型根据所述初始模型参数和所述第一历史同期的第一历史业务数据对所述第二历史同期的业务数据进行预测，得到所述第二历史同期的预测业务数据；

根据所述预测业务数据和所述第二历史同期的第二历史业务数据，计算得到所述预测残差值；

调用所述预测模型根据所述初始模型参数、所述第一历史业务数据和所述第二历史业务数据对所述指定时段内的业务数据进行预测，得到所述第一预测结果。
根据权利要求12所述的方法，其中，根据所述预测业务数据和所述第二历史同期的第二历史业务数据，计算得到所述预测残差值，包括：

计算所述第二历史业务数据与对应的所述预测业务数据的差值，将所述差值确定为所述预测残差值。
根据权利要求1-13任一所述的方法，其中，所述根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据，包括：

获取所述第一预测结果和所述第二预测结果之间的和值，并将所述和值作为所述指定时段的预测数据。
一种业务数据预测装置，其中，包括：

历史数据获取模块，用于在需要对未来的指定时段内的业务数据进行预测时，获取与所述指定时段对应的历史同期的历史业务数据；

模型参数确定模块，用于根据所述历史业务数据，确定预测模型对应的初始模型参数；

第一结果预测模块，用于调用所述预测模型根据所述初始模型参数和所述历史业务数据，预测得到所述指定时段对应的第一预测结果和预测残差值；

目标参数确定模块，用于根据所述预测残差值，确定所述预测模型对应的目标模型参数；

第二结果预测模块，用于调用所述预测模型根据所述目标模型参数和所述历史业务数据，对所述预测残差值进行处理，得到所述指定时段对应的第二预测结果；

预测数据确定模块，用于根据所述第一预测结果和所述第二预测结果，确定所述指定时段对应的预测数据。
根据权利要求15所述的装置，其中，所述历史数据获取模块，包括：

初始业务数据获取单元，用于获取所述历史同期的初始历史业务数据；

历史业务数据筛选单元，用于对所述初始历史业务数据进行筛选，得到所述历史业务数据。
根据权利要求15所述的装置，其中，所述模型参数确定模块，包括：

第一模型参数获取单元，用于对所述历史业务数据进行差分处理，得到所述预测模型对应的第一模型参数；

第二模型参数获取单元，用于对所述历史业务数据进行定阶处理，得到所述预测模型对应的第二模型参数和第三模型参数。
根据权利要求15所述的装置，其中，所述历史同期包括第一历史同期和第二历史同期，所述第一历史同期的时间早于所述第二历史同期，所述第一结果预测模块，包括：

预测业务数据获取单元，用于调用所述预测模型根据所述初始模型参数和所述第一历史同期的第一历史业务数据对所述第二历史同期的业务数据进行预测，得到所述第二历史同期的预测业务数据；

预测残差值计算单元，用于根据所述预测业务数据和所述第二历史同期的第二历史业务数据，计算得到所述预测残差值；

第一预测结果获取单元，用于调用所述预测模型根据所述初始模型参数、所述第一历史业务数据和所述第二历史业务数据对所述指定时段内的业务数据进行预测，得到所述第一预测结果。
一种电子设备，其中，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至14任一项所述的业务数据预测方法。
一种计算机可读存储介质，其中，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行权利要求1至14任一项所述的业务数据预测方法。
一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备上运行时，导致所述电子设备执行根据权利要求1至14中任一项所述的业务数据预测方法。