CN110287086A

CN110287086A - 一种周期性时间的交易量预测方法及装置

Info

Publication number: CN110287086A
Application number: CN201910592938.XA
Authority: CN
Inventors: 滕飞; 罗涛; 夏冬
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2019-07-03
Filing date: 2019-07-03
Publication date: 2019-09-27

Abstract

本发明提供一种周期性时间的交易量预测方法及装置，所述方法包括：根据历史交易数据获得待预测时刻对应的第一时间序列数据；其中，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性；根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值；根据交易量差分值和所述交易量基准值，获得所述待预测时刻的交易量预测值；其中，所述交易量差分值是根据所述历史交易数据预先获得的。所述装置用于执行上述方法。本发明实施例提供的周期性时间的交易量预测方法及装置，提高了交易量预测的准确性。

Description

一种周期性时间的交易量预测方法及装置

技术领域

本发明涉及数据处理技术领域，具体涉及一种周期性时间的交易量预测方法及装置。

背景技术

目前，数据中心数据量快速增长，数据处理的压力越来越大。如能够快速、准确的预测基于时间周期的交易量变化情况，则具有较大意义，一是可提早获知业务高峰时间，提高IT部门应对业务高峰的处理效率；二是通过准确预测交易量可实现利润增长、效益投放、资源配比、业务稳定等。

现有技术中，关于时间序列交易量预测，主要采用自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model，简称ARIMA)，其将预测对象随时间推移而形成的数据序列视为一个随机序列，用数学模型来近似描述这个序列，根据时间序列的过去值、现在值来预测未来值。但是，ARIMA模型存在如下问题：一是不能处理周期性数据；二是预测时间一般为5分钟，预测时间越长，预测结果越难以收敛。在金融业等应用场景中，由于对系统可靠性和稳定性要求非常高，ARIMA只支持短时间、非周期性交易量预测无法满足业务的要求。

因此，如何提出一种周期性时间的交易量预测方法，能够在延长预测时间的情况下，提高对交易量预测的准确性成为本领域需要解决的重要课题。

发明内容

针对现有技术中的问题，本发明实施例提供一种周期性时间的交易量预测方法及装置。

一方面，本发明提出一种周期性时间的交易量预测方法，包括：

根据历史交易数据获得待预测时刻对应的第一时间序列数据；其中，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性；

根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值；

根据交易量差分值和所述交易量基准值，获得所述待预测时刻的交易量预测值；其中，所述交易量差分值是根据所述历史交易数据预先获得的。

另一方面，本发明提供一种周期性时间的交易量预测装置，包括：

第一数据获得模块，用于根据历史交易数据获得待预测时刻对应的第一时间序列数据；其中，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性；

基准值获得模块，用于根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值；

预测模块，用于根据交易量差分值和所述交易量基准值，获得所述待预测时刻的交易量预测值；其中，所述交易量差分值是根据所述历史交易数据预先获得的。

再一方面，本发明提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一实施例所述周期性时间的交易量预测方法的步骤。

又一方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述任一实施例所述周期性时间的交易量预测方法的步骤。

本发明实施例提供的周期性时间的交易量预测方法及装置，根据历史交易数据获得待预测时刻对应的第一时间序列数据，并根据第一时间序列数据，获得待预测时刻的交易量基准值，然后根据交易量差分值和交易量基准值，获得待预测时刻的交易量预测值，在延长交易量的预测周期的情况下，提高了交易量预测的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1是本发明一实施例提供的周期性时间的交易量预测方法的流程示意图。

图2是本发明另一实施例提供的周期性时间的交易量预测方法的流程示意图。

图3是本发明再一实施例提供的周期性时间的交易量预测方法的流程示意图。

图4是本发明又一实施例提供的周期性时间的交易量预测方法的流程示意图。

图5是本发明还一实施例提供的周期性时间的交易量预测方法的流程示意图。

图6是本发明一实施例提供的周期性时间的交易量预测系统的结构示意图。

图7是本发明一实施例提供的周期性时间的交易量预测装置的结构示意图。

图8是本发明另一实施例提供的周期性时间的交易量预测装置的结构示意图。

图9是本发明再一实施例提供的周期性时间的交易量预测装置的结构示意图。

图10是本发明又一实施例提供的周期性时间的交易量预测装置的结构示意图。

图11是本发明还一实施例提供的周期性时间的交易量预测装置的结构示意图。

图12为本发明一实施例提供的电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合附图对本发明实施例做进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。

图1是本发明一实施例提供的周期性时间的交易量预测方法的流程示意图，如图1所示，本发明实施例提供的周期性时间的交易量预测方法，包括：

S101、根据历史交易数据获得待预测时刻对应的第一时间序列数据；其中，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性；

具体地，所述历史交易数据可以包括过去每天每个时刻的交易数据，从所述历史交易数据中可以获得待预测时刻对应的第一时间序列数据。所述第一时间序列数据即按照时间先后顺序排列的交易数据，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性，交易量日期属性是指交易量发生的日期为工作日、周末、双十一等属性，例如所述第一时间序列数据中的所有第一样本数据都发生在工作日，或者都发生在周末，或者都发生在双十一。所述第一时间序列数据与所述待预测时刻对应是指每个所述第一样本数据对应的时刻与所述预测时刻的时间点相同，但是日期不同。所述待预测时刻可以为要预测的下一天的任意时间点，根据实际需要进行设置，本发明实施例不做限定。其中，所述交易量日期属性根据实际情况进行设置，本发明实施例不做限定。所述第一时间序列数据包括的第一样本数据的数量根据实际需要进行设置，本发明实施例不做限定。本发明实施例提供的周期性时间的交易量预测方法的执行主体包括但不限于台式机、笔记本和平板电脑。

例如，所述待预测时刻为T日的10:00，且T日为工作日，那么可以从所述历史交易数据中获得T日之前的连续10个工作日的每个工作日的10:00的交易数据，按照10个工作日的日期先后顺序排列，构成T日的10:00对应的第一时间序列数据。

S102、根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值；

具体地，在获得所述第一时间序列数据之后，可以根据所述第一时间序列数据中的各个第一样本数据，获得所述待预测时刻的交易量的基准值。

例如，获得的所述第一时间序列数据包括10个第一样本数据，从10个第一样本数据中去除一个最大值和一个最小值，对剩余的8个第一样本数据求平均值，得到的平均值作为所述所述待预测时刻的交易量基准值。

S103、根据交易量差分值和所述交易量基准值，获得所述待预测时刻的交易量预测值；其中，所述交易量差分值是根据所述历史交易数据预先获得的。

具体地，在获得所述交易量基准值之后，可以将所述交易量基准值与交易量差分值求和，将求和的结果作为所述待预测时刻的交易量预测值。其中，所述交易量差分值是根据所述历史交易数据预先获得的，所述交易量差分值的具体获得过程详见下文所述，此处不进行赘述。

例如，获得T日10:00对应的交易量基准值为T_m，预先获得的交易量差分值为T_d，那么T日10:00的交易量预测值T_r＝T_m+T_d。可理解的是，如果当前时间为T-1日，采用本发明实施例提供的周期性时间的交易量预测方法，可以对T日每个时刻的交易数据进行预测。

本发明实施例提供的周期性时间的交易量预测方法，根据历史交易数据获得待预测时刻对应的第一时间序列数据，并根据第一时间序列数据，获得待预测时刻的交易量基准值，然后根据交易量差分值和交易量基准值，获得待预测时刻的交易量预测值，在延长预测时间的情况下，提高了交易量预测的准确性。

图2是本发明另一实施例提供的周期性时间的交易量预测方法的流程示意图，如图2所示，在上述各实施例的基础上，进一步地，根据所述历史交易数据获得所述交易量差分值包括：

S201、根据所述历史交易数据获得与所述待预测时刻对应的第二时间序列数据；其中，所述第二时间序列数据中的每个第二样本数据具有相同的交易量日期属性；

具体地，从所述历史交易数据中可以获得所述待预测时刻对应的第二时间序列数据。所述第二时间序列数据是按照时间先后顺序排列的交易数据，所述第二时间序列数据中的每个第二样本数据具有相同的交易量日期属性。所述第二时间序列数据与所述待预测时刻对应是指每个所述第二样本数据对应的时刻与所述预测时刻的时间点相同，但是日期不同。其中，所述第二时间序列数据包括的第二样本数据的数量根据实际经验进行设置，本发明实施例不做限定。

S202、将所述第二时间序列数据划分为训练集和测试集；

具体地，在获得所述第二时间序列数据之后，将所述第二时间序列数据划分为训练集和测试集，所述训练集用于模型的建立，所述测试集用于模型的验证。

例如，将所述第二时间序列数据中70％的第二样本数据划分到所述训练集，30％的第二样本数据划分到所述测试集。

S203、根据所述训练集和差分自回归移动平均模型，建立待验证差分值预测模型；

具体地，差分自回归移动平均模型根据历史数据规律来预测未来情况，当历史数据足够多时，便能够覆盖一定周期范围内的变化情况。根据所述训练集和差分自回归移动平均模型，建立待验证差分值预测模型，就是根据所述训练集来确定差分自回归移动平均模型ARIMA(p，q，d)中的p、q和d，其中p为自回归的阶数，d为差分阶数，q为滑动平均阶数。首先，需要检测所述训练集的平稳性，可以用单位根法检测所述训练集的平稳性，如果所述训练集不平稳，那么对所述训练集进行差分处理，最终得到一个平稳的时间序列数据，即对所述训练集进行一阶差分，再对一阶差分后的训练集进行平稳性检测，如果依然不平稳，则再进行差分，直到得到一个平稳的时间序列数据。如果所述训练集平稳，说明所述训练集本身就是一个平稳的时间序列数据。根据差分处理的次数可以确定出d值。接着，在获得平稳的时间序列数据之后，可以通过偏自相关系数PACF方法获得p值，通过自相关系数ACF方法获得q值，p值和q值的具体获得方法为现有技术，此处不进行赘述。在得到d、q和p值之后，就可以建立所述待验证差分值预测模型，在实际应用中，如果得到多组d、q和p值时，可以采用AIC(赤池信息量)和BIC(贝叶斯信息量)值从多组d、q和p值中选择出一组d、q和p值建立所述待验证差分值预测模型。

S204、根据所述测试集对所述待验证差分值预测模型进行验证，并将通过验证的所述待验证差分值预测模型作为所述待预测时刻对应的差分值预测模型；

具体地，在获得所述待验证差分值预测模型之后，利用所述测试集对所述待验证差分模型进行验证，例如可以采用交叉验证法对所述待验证差分值预测模型进行验证，如果所述待验证差分值预测模型通过验证，那么将通过验证的所述待验证差分值预测模型作为所述待预测时刻对应的差分值预测模型。如果所述待验证差分值预测模型没有通过验证，可以通过调整d、q、p值中的至少一个值，来最终获得通过验证的所述待验证差分值预测模型。

S205、根据所述第二时间序列数据和所述差分值预测模型，获得所述交易量差分值。

具体地，在获得所述差分值预测模型之后，将所述第二时间序列数据输入到所述差分值预测模型，从而得到所述交易量的差分值。

为了提高预测效率，所述交易量差分值可以用于未来多个日期的时间点t₀的交易量预测值的预测。例如，在T日根据T日之前的历史交易数据获得了时间点t₀的交易量差分值S，在预测T+1日在时间点t₀的交易量预测值时，可以根据T-15日到T日的历史交易数据，获得T+1日在时间点t₀对应的第一时间序列数据，然后根据T+1日在时间点t₀对应的第一时间序列数据，获得T+1日在时间点t₀对应的交易量基准值X₁，然后根据T+1日的在时间点t₀对应的交易量基准值X₁和时间点t₀的交易量差分值S，获得T+1日在时间点t₀的交易量预测值为X₁+S。在预测T+2日在时间点t₀的交易量预测值时，可以根据T-14日到T+1日的历史交易数据，获得T+2日在时间点t₀对应的第一时间序列数据，然后根据T+2日在时间点t₀对应的第一时间序列数据，获得T+2日在时间点t₀对应的交易量基准值X₂，然后根据T+2日的在时间点t₀对应的交易量基准值X₂和时间点t₀的交易量差分值S，获得T+2日在时间点t₀的交易量预测值为X₂+S。

图3是本发明再一实施例提供的周期性时间的交易量预测方法的流程示意图，如图3所示，在上述各实施例的基础上，进一步地，所述根据所述历史交易数据获得与所述待预测时刻对应的第二时间序列数据包括：

S2011、根据所述历史交易数据，获得所述待预测时刻对应的待检测的第二时间序列数据；

具体地，为了保证获得的差分值预测模型的准确性，所述第二时间序列数据中不能包括异常交易量。可以从所述历史交易数据中获得原始的交易数据，得到与所述待预测时刻对应的待检测的第二时间序列数据。所述待检测的第二时间序列数据是按照时间先后顺序排列的交易数据，该交易数据是从所述历史交易数据中直接获得的没有经过任何处理，所述待检测的第二时间序列数据中的每个待测样本数据具有相同的交易量日期属性。所述待检测的第二时间序列数据与所述待预测时刻对应是指每个所述待测样本数据对应的时刻与所述预测时刻的时间点相同，但是日期不同。

S2012、对所述待检测的第二时间序列数据中的每个待测样本数据进行异常检测；

具体地，在获得所述待检测的第二时间序列数据之后，对所述待检测的第二时间序列数据中的每个待测样本数据进行异常检测，以判断所述待检测的第二时间序列数据中是否存在异常的数据。

例如，可以根据所述历史交易数据，获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据；然后，根据每个所述待测样本数据对应的预测时间序列数据和预测模型，获得每个所述待测样本数据对应的预测值；其中，所述预测模型是根据自回归积分滑动平均模型预先建立的；最后，根据每个所述待测样本数据与对应的预测值的差值和预设阈值，判断每个所述待测样本数据是否异常。

S2013、若判断获知所述待检测的第二时间序列数据中的待测样本数据存在异常，则根据异常处理规则对所述待检测的第二时间序列数据进行处理，获得所述第二时间序列数据。

具体地，如果检测出所述待检测的第二时间序列数据中存在异常的待测样本数据，那么所述待检测的第二时间序列数据中的待测样本数据存在异常，可以根据异常处理规则对所述待检测的第二时间序列数据中的所有异常的待测样本数据进行处理，处理后的所述待检测的第二时间序列数据不再有异常的待测样本数据，可以作为所述第二时间序列数据。

图4是本发明又一实施例提供的周期性时间的交易量预测方法的流程示意图，如图4所示，在上述各实施例的基础上，进一步地，所述对所述待检测的第二时间序列数据中的每个待测样本数据进行异常检测包括：

S20121、根据所述历史交易数据，获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据；

具体地，在本申请实施例中，判断待测样本数据是否异常，需要使用每个待测样本数据对应的预测值，为了获得每个所述待测样本的预测值，需要从所述历史交易数据中，获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列书，每个所述待测样本数据对应的预测时间序列数据是一组按照时间先后顺序排列的交易数据，是分钟级的交易数据，用于短时间的交易量预测。其中，所述预测时间序列数据包括的数据的数量根据实际需要进行设置，本发明实施例不做限定。

S20122、根据每个所述待测样本数据对应的预测时间序列数据和预测模型，获得每个所述待测样本数据对应的预测值；其中，所述预测模型是根据自回归积分滑动平均模型预先建立的；

具体地，在获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据之后，将每个所述待测样本数据对应的预测时间序列数据输入到所述预测模型中，获得每个所述待测样本数据对应的预测值。其中，所述预测模型是传统的自回归积分滑动平均模型训练后获得的，对传统的ARIMA训练获得所述预测模型的过程为现有技术，此处不进行赘述。

S20123、根据每个所述待测样本数据与对应的预测值的差值和预设阈值，判断每个所述待测样本数据是否异常。

具体地，在获得每个所述待测样本数据对应的预测值之后，计算每个所述待测样本数据与对应的预测值的差值，获得每个所述待测样本数据对应的差值，将每个所述待测样本数据对应的差值的绝对值与预设阈值进行比较，如果所述差值的绝对值大于所述预设阈值，那么所述差值对应的待测样本数据异常，如果所述差值的绝对值小于或者等于所述预设阈值，那么所述差值对应的待测样本数据不存在异常。

图5是本发明还一实施例提供的周期性时间的交易量预测方法的流程示意图，如图5所示，在上述各实施例的基础上，进一步地，所述根据异常处理规则对所述待检测的第二时间序列数据进行处理，获得所述第二时间序列数据包括：

S20131、若判断获知异常的待测样本数据不连续，则使用所述异常的待测样本数据对应的预测值替换所述异常的待测样本数据；

具体地，对于异常的待测样本数据，可以判断异常的待测样本数据是否连续，即是否存在超过预设数量个连续的待测样本数据都异常，如果不存在，说明所述异常的待测样本数据不连续，那么将异常的待测样本数据中的每个待测样本数据替换为各自对应的预测值。其中，所述预设数量根据实际经验进行设置，本发明实施例不做限定。

S20132、若判断获知所述异常的待测样本数据连续且不稳定，则使用所述异常的待测样本数据对应的预测值替换所述异常的待测样本数据；

具体地，如果存在超过所述预设数量个连续的待测样本数据都异常，说明所述异常的待测样本数据连续，接着判断所述超过所述预设数量个连续的待测样本数据是否稳定，可以采用标准分数法判断所述超过所述预设数量个连续的待测样本数据是否稳定，如果所述超过所述预设数量个连续的待测样本数据不稳定，那么将所述超过所述预设数量个连续的待测样本数据替换为各自对应的预测值。

例如，有n个连续的待测样本数据都异常，所述预设数量为m，如果n>m，说明所述n个异常的待测样本数据连续。计算n个连续的待测样本数据的平均值为Q，再计算n个连续的待测样本数据的标准差为σ，那么n个连续的待测样本数据中第i个待测样本数据A_i的标准分数为z_i＝(A_i-Q)/σ，如果n个连续的待测样本数据中的每个待测样本数据的标准分数的绝对值小于设定阈值，说明n个连续的待测样本数据稳定，否则n个连续的待测样本数据不稳定。

S20133、若判断获知所述异常的待测样本数据连续且稳定，则在所述第二时间序列数据中保留所述异常的待测样本数据。

具体地，如果存在超过所述预设数量个连续的待测样本数据都异常，说明所述异常的待测样本数据连续，判断所述超过所述预设数量个连续的待测样本数据是否稳定，可以采用标准分数法判断所述超过所述预设数量个连续的待测样本数据是否稳定，如果所述超过所述预设数量个连续的待测样本数据稳定，可以将所述超过所述预设数量个连续的待测样本数据视为因业务调整而产生的正常数据，不对所述超过所述预设数量个连续的待测样本数据进行处理，在所述第二时间序列数据中保留所述超过所述预设数量个连续的待测样本数据，即在所述第二时间序列数据中保留连续且稳定的异常的待测样本数据。

在上述各实施例的基础上，进一步地，所述根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值包括：

从所述第一时间序列数据中去除最大的第一样本数据和最小的第一样本数据，对剩余的第一样本数据求平均值，将获得的平均值作为所述待预测时刻的交易量基准值。

具体地，在获得所述第一时间序列数据之后，可以从所述第一时间序列数据中去除最大的第一样本数据和最小的第一样本数据，然后计算剩余的第一时间序列数据的平均值，将所述平均值作为所述待预测时刻的交易量基准值。其中，所述剩余第一时间序列数据即所述第一时间序列数据中去除最大的第一样本数据和最小的第一样本数之后剩下的第一样本数据。

图6是本发明一实施例提供的周期性时间的交易量预测系统的结构示意图，如图6所示，所述系统用于执行上述任一实施例所述的方法，所述系统包括输入装置601、预处理装置602、训练装置603、基准装置604、预测装置605和输出装置606，其中：

输入装置601用于根据交易量日期属性对历史交易数据进行分类。根据不同日期交易量的特点，将数据按照工作日、周末、长假前夕、双十一等周期因素将所述历史交易数据进行分类，可以有效避免数据日期因素对预测模型的影响。

预处理装置602用于实现数据的重定序列和剔除脏点处理操作。重定序列操作将严格的时序数据按照分钟级(如每天的同一时间点)重排生成时序数列，可以从输入装置601获得的分类数据中，获得待预测时刻对应的所述待检测的第二时间序列数据以及所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据。预处理装置602还可以根据所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据以及所述预测模型，获得每个所述待测样本数据对应的预测值，再根据每个所述待测样本数据与对应的预测值的差值和预设阈值，判断每个所述待测样本数据是否异常，异常的所述待测样本数据即为脏点。预处理装置602在判断获知所述待检测的第二时间序列数据中的待测样本数据存在异常之后，根据异常处理规则对所述待检测的第二时间序列数据进行处理，获得待预测时刻对应的所述第二时间序列数据。

训练装置603用于建立差分值预测模型。训练装置603将所述第二时间序列数据划分为训练集和测试集，并根据所述训练集和差分自回归移动平均模型，建立待验证差分值预测模型；然后，根据所述测试集对所述待验证交易量预测模型进行验证，并将通过验证的所述待验证差分值预测模型作为所述待预测时刻对应的差分值预测模型。在建立所述待验证差分值预测模型的过程中，需要对所述训练集进行平稳性计算。

预测装置605用于根据所述第二时间序列数据和所述差分值预测模型，获得差分值，即将所述第二时间序列数据输入到所述差分值预测模型中，获得所述差分值。

基准装置604用于获得所述第一时间序列数据，并根据所述第一时间序列数据获得待预测时刻的交易量基准值。其中，基准装置604可以从输入装置601获得的分类数据中，获得所述待预测时刻对应的第一时间序列数据。

输出装置606，用于根据所述差分值和所述交易量基准值，获得所述待预测时刻对应的交易量预测值。输出装置606可以将所述差分值和所述交易量基准值求和，将求和的结果作为所述待预测时刻对应的交易量预测值。

其中，可以获得所述差分值在置信区间内的最大差分值和最小差分值，然后将所述最大差分值和所述交易量基准值之和作为对应的监控区间的上限值，将所述最小差分值和所述交易量基准值之和作为对应的监控区间的下限值，使得所述监控阈值随着所述差分值和所述基准值的变化而变化，成为动态监控区间，避免固定监控区间导致的误报和漏报，有效规避固定监控区间的局限性。

图7是本发明一实施例提供的周期性时间的交易量预测装置的结构示意图，如图7所示，本发明实施例提供的周期性时间的交易量预测装置包括第一数据获得模块701、基准值获得模块702和预测模块703，其中：

第一数据获得模块701用于根据历史交易数据获得待预测时刻对应的第一时间序列数据；其中，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性；基准值获得模块702用于根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值；预测模块703用于根据交易量差分值和所述交易量基准值，获得所述待预测时刻的交易量预测值；其中，所述交易量差分值是根据所述历史交易数据预先获得的。

具体地，所述历史交易数据可以包括过去每天每个时刻的交易数据，第一数据获得模块701可以从所述历史交易数据中可以获得待预测时刻对应的第一时间序列数据。所述第一时间序列数据即按照时间先后顺序排列的交易数据，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性，交易量日期属性是指交易量发生的日期为工作日、周末、双十一等属性，例如所述第一时间序列数据中的所有第一样本数据都发生在工作日，或者都发生在周末，或者都发生在双十一。所述第一时间序列数据与所述待预测时刻对应是指每个所述第一样本数据对应的时刻与所述预测时刻的时间点相同，但是日期不同。所述待预测时刻可以为要预测的下一天的任意时间点，根据实际需要进行设置，本发明实施例不做限定。其中，所述交易量日期属性根据实际情况进行设置，本发明实施例不做限定。所述第一时间序列数据包括的第一样本数据的数量根据实际需要进行设置，本发明实施例不做限定。

在获得所述第一时间序列数据之后，基准值获得模块702可以根据所述第一时间序列数据中的各个第一样本数据，获得所述待预测时刻的交易量的基准值。

在获得所述交易量基准值之后，预测模块703可以将所述交易量基准值与交易量差分值求和，将求和的结果作为所述待预测时刻的交易量预测值。

本发明实施例提供的周期性时间的交易量预测装置，根据历史交易数据获得待预测时刻对应的第一时间序列数据，并根据第一时间序列数据，获得待预测时刻的交易量基准值，然后根据交易量差分值和交易量基准值，获得待预测时刻的交易量预测值，在延长预测时间的情况下，提高了交易量预测的准确性。

图8是本发明另一实施例提供的周期性时间的交易量预测装置的结构示意图，如图8所示，在上述各实施例的基础上，进一步地，本发明实施例提供的周期性时间的交易量预测装置还包括第二数据获得模块704、划分模块705、建立模块706、验证模块707和获得模块708，其中：

第二数据获得模块704用于根据所述历史交易数据获得所述待预测时刻对应的第二时间序列数据；其中，所述第二时间序列数据中的每个第二样本数据具有相同的交易量日期属性；划分模块705用于将所述第二时间序列数据划分为训练集和测试集；建立模块706用于根据所述训练集和差分自回归移动平均模型，建立待验证差分值预测模型；验证模块707用于根据所述测试集对所述待验证交易量预测模型进行验证，并将通过验证的所述待验证差分值预测模型作为所述待预测时刻对应的差分值预测模型；获得模块708用于根据所述第二时间序列数据和所述差分值预测模型，获得所述交易量差分值。

具体地，第二数据获得模块704从所述历史交易数据中可以获得所述待预测时刻对应的第二时间序列数据。所述第二时间序列数据是按照时间先后顺序排列的交易数据，所述第二时间序列数据中的每个第二样本数据具有相同的交易量日期属性。所述第二时间序列数据与所述待预测时刻对应是指每个所述第二样本数据对应的时刻与所述预测时刻的时间点相同，但是日期不同。其中，所述第二时间序列数据包括的第二样本数据的数量根据实际经验进行设置，本发明实施例不做限定。

在获得所述第二时间序列数据之后，划分模块705将所述第二时间序列数据划分为训练集和测试集，所述训练集用于模型的建立，所述测试集用于模型的验证。

差分自回归移动平均模型根据历史数据规律来预测未来情况，当历史数据足够多时，便能够覆盖一定周期范围内的变化情况。根据所述训练集和差分自回归移动平均模型，建立待验证差分值预测模型，就是根据所述训练集来确定差分自回归移动平均模型ARIMA(p，q，d)中的p、q和d，其中p为自回归的阶数，d为差分阶数，q为滑动平均阶数。首先，建立模块706需要检测所述训练集的平稳性，可以用单位根法检测所述训练集的平稳性，如果所述训练集不平稳，那么对所述训练集进行差分处理，最终得到一个平稳的时间序列数据，即对所述训练集进行一阶差分，再对一阶差分后的训练集进行平稳性检测，如果依然不平稳，则再进行差分，直到得到一个平稳的时间序列数据。如果所述训练集平稳，说明所述训练集本身就是一个平稳的时间序列数据。根据差分处理的次数可以确定出d值。接着，建立模块706在获得平稳的时间序列数据之后，可以通过偏自相关系数PACF方法获得p值，通过自相关系数ACF方法获得q值，p值和q值的具体获得方法为现有技术，此处不进行赘述。在得到d、q和p值之后，建立模块706就可以建立所述待验证差分值预测模型，在实际应用中，如果得到多组d、q和p值时，可以采用AIC(赤池信息量)和BIC(贝叶斯信息量)值从多组d、q和p值中选择出一组d、q和p值建立所述待验证差分值预测模型。

在获得所述待验证差分值预测模型之后，验证模块707利用所述测试集对所述待验证差分模型进行验证，例如可以采用交叉验证法对所述待验证差分值预测模型进行验证，如果所述待验证差分值预测模型通过验证，那么将通过验证的所述待验证差分值预测模型作为所述待预测时刻对应的差分值预测模型。如果所述待验证差分值预测模型没有通过验证，可以通过调整d、q、p值中的至少一个值，来最终获得通过验证的所述待验证差分值预测模型。

在获得所述差分值预测模型之后，获得模块708将所述第二时间序列数据输入到所述差分值预测模型，从而得到所述交易量的差分值。

图9是本发明再一实施例提供的周期性时间的交易量预测装置的结构示意图，如图9所述，在上述各实施例的基础上，进一步地，第二数据获得模块704包括获得单元7041、检测单元7042和处理单元7043，其中：

获得单元7041用于根据所述历史交易数据，获得与所述待预测时刻对应的待检测的第二时间序列数据；检测单元7042用于对所述待检测的第二时间序列数据中的每个待测样本数据进行异常检测；处理单元7043用于在判断获知所述待检测的第二时间序列数据中的待测样本数据存在异常之后，根据异常处理规则对所述待检测的第二时间序列数据进行处理，获得所述第二时间序列数据。

具体地，为了保证获得的差分值预测模型的准确性，所述第二时间序列数据中不能包括异常交易量。获得单元7041可以从所述历史交易数据中获得原始的交易数据，得到与所述待预测时刻对应的待检测的第二时间序列数据。所述待检测的第二时间序列数据是按照时间先后顺序排列的交易数据，该交易数据是从所述历史交易数据中直接获得的没有经过任何处理，所述待检测的第二时间序列数据中的每个待测样本数据具有相同的交易量日期属性。所述待检测的第二时间序列数据与所述待预测时刻对应是指每个所述待测样本数据对应的时刻与所述预测时刻的时间点相同，但是日期不同。

在获得所述待检测的第二时间序列数据之后，检测单元7042对所述待检测的第二时间序列数据中的每个待测样本数据进行异常检测，以判断所述待检测的第二时间序列数据中是否存在异常的数据。

处理单元7043如果检测出所述待检测的第二时间序列数据中存在异常的待测样本数据，那么所述待检测的第二时间序列数据中的待测样本数据存在异常，可以根据异常处理规则对所述待检测的第二时间序列数据中的所有异常的待测样本数据进行处理，处理后的所述待检测的第二时间序列数据不再有异常的待测样本数据，可以作为所述第二时间序列数据。

图10是本发明又一实施例提供的周期性时间的交易量预测装置的结构示意图，如图10所示，在上述各实施例的基础上，进一步地，检测单元7042包括获得子单元70421、预测子单元70422和判断子单元70423，其中：

获得子单元70421用于根据所述历史交易数据，获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据；预测子单元70422用于根据每个所述待测样本数据对应的预测时间序列数据和预测模型，获得每个所述待测样本数据对应的预测值；其中，所述预测模型是根据自回归积分滑动平均模型预先建立的；判断子单元70423用于根据每个所述待测样本数据与对应的预测值的差值和预设阈值，判断每个所述待测样本数据是否异常。

具体地，在本申请实施例中，判断待测样本数据是否异常，需要使用每个待测样本数据对应的预测值，为了获得每个所述待测样本的预测值，获得子单元70421需要从所述历史交易数据中，获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列书，每个所述待测样本数据对应的预测时间序列数据是一组按照时间先后顺序排列的交易数据，是分钟级的交易数据，用于短时间的交易量预测。其中，所述预测时间序列数据包括的数据的数量根据实际需要进行设置，本发明实施例不做限定。

在获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据之后，预测子单元70422将每个所述待测样本数据对应的预测时间序列数据输入到所述预测模型中，获得每个所述待测样本数据对应的预测值。其中，所述预测模型是传统的自回归积分滑动平均模型训练后获得的，对传统的ARIMA训练获得所述预测模型的过程为现有技术，此处不进行赘述。

在获得每个所述待测样本数据对应的预测值之后，判断子单元70423计算每个所述待测样本数据与对应的预测值的差值，获得每个所述待测样本数据对应的差值，将每个所述待测样本数据对应的差值的绝对值与预设阈值进行比较，如果所述差值的绝对值大于所述预设阈值，那么所述差值对应的待测样本数据异常，如果所述差值的绝对值小于或者等于所述预设阈值，那么所述差值对应的待测样本数据不存在异常。

图11是本发明还一实施例提供的周期性时间的交易量预测装置的结构示意图，如图11所示，在上述各实施例的基础上，进一步地，处理单元7043包括第一处理子单元70431、第二处理子单元70432和第三处理子单元70433，其中：

第一处理子单元70431用于在判断获知异常的待测样本数据不连续之后，使用所述异常的待测样本数据对应的预测值替换所述异常的待测样本数据；第二处理子单元70432用于在判断获知所述异常的待测样本数据连续且不稳定之后，使用所述异常的待测样本数据对应的预测值替换所述异常的待测样本数据；第三处理子单元70433用于在判断获知所述异常的待测样本数据连续且稳定之后，在所述第二时间序列数据中保留所述异常的待测样本数据。

具体地，对于异常的待测样本数据，第一处理子单元70431可以判断异常的待测样本数据是否连续，即是否存在超过预设数量个连续的待测样本数据都异常，如果不存在，说明所述异常的待测样本数据不连续，那么将异常的待测样本数据中的每个待测样本数据替换为各自对应的预测值。其中，所述预设数量根据实际经验进行设置，本发明实施例不做限定。

第二处理子单元70432判断出存在超过所述预设数量个连续的待测样本数据都异常，说明所述异常的待测样本数据连续，接着判断所述超过所述预设数量个连续的待测样本数据是否稳定，可以采用标准分数法判断所述超过所述预设数量个连续的待测样本数据是否稳定，如果所述超过所述预设数量个连续的待测样本数据不稳定，那么将所述超过所述预设数量个连续的待测样本数据替换为各自对应的预测值。

第三处理子单元70433判断出存在超过所述预设数量个连续的待测样本数据都异常，说明所述异常的待测样本数据连续，接着判断所述超过所述预设数量个连续的待测样本数据是否稳定，可以采用标准分数法判断所述超过所述预设数量个连续的待测样本数据是否稳定，如果所述超过所述预设数量个连续的待测样本数据稳定，可以将所述超过所述预设数量个连续的待测样本数据视为因业务调整而产生的正常数据，不对所述超过所述预设数量个连续的待测样本数据进行处理，在所述第二时间序列数据中保留所述超过所述预设数量个连续的待测样本数据，即在所述第二时间序列数据中保留连续且稳定的异常的待测样本数据。

在上述各实施例的基础上，进一步地，预测模块703具体用于：

具体地，在获得所述第一时间序列数据之后，预测模块703可以从所述第一时间序列数据中去除最大的第一样本数据和最小的第一样本数据，然后计算剩余的第一时间序列数据的平均值，将所述平均值作为所述待预测时刻的交易量基准值。其中，所述剩余第一时间序列数据即所述第一时间序列数据中去除最大的第一样本数据和最小的第一样本数之后剩下的第一样本数据。

图12为本发明一实施例提供的电子设备的实体结构示意图，如图12所示，该电子设备可以包括：处理器(processor)1201、通信接口(Communications Interface)1202、存储器(memory)1203和通信总线1204，其中，处理器1201，通信接口1202，存储器1203通过通信总线1204完成相互间的通信。处理器1201可以调用存储器1203中的逻辑指令，以执行如下方法：根据历史交易数据获得待预测时刻对应的第一时间序列数据；其中，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性；根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值；根据交易量差分值和所述交易量基准值，获得所述待预测时刻的交易量预测值；其中，所述交易量差分值是根据所述历史交易数据预先获得的。

此外，上述的存储器1203中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如包括：根据历史交易数据获得待预测时刻对应的第一时间序列数据；其中，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性；根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值；根据交易量差分值和所述交易量基准值，获得所述待预测时刻的交易量预测值；其中，所述交易量差分值是根据所述历史交易数据预先获得的。

本实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储计算机程序，所述计算机程序使所述计算机执行上述各方法实施例所提供的方法，例如包括：根据历史交易数据获得待预测时刻对应的第一时间序列数据；其中，所述第一时间序列数据中的每个第一样本数据具有相同的交易量日期属性；根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值；根据交易量差分值和所述交易量基准值，获得所述待预测时刻的交易量预测值；其中，所述交易量差分值是根据所述历史交易数据预先获得的。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在本说明书的描述中，参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种周期性时间的交易量预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，根据所述历史交易数据获得所述交易量差分值包括：

根据所述历史交易数据获得所述待预测时刻对应的第二时间序列数据；其中，所述第二时间序列数据中的每个第二样本数据具有相同的交易量日期属性；

将所述第二时间序列数据划分为训练集和测试集；

根据所述训练集和差分自回归移动平均模型，建立待验证差分值预测模型；

根据所述测试集对所述待验证交易量预测模型进行验证，并将通过验证的所述待验证差分值预测模型作为所述待预测时刻对应的差分值预测模型；

根据所述第二时间序列数据和所述差分值预测模型，获得所述交易量差分值。

3.根据权利要求2所述的方法，其特征在于，所述根据所述历史交易数据获得与所述待预测时刻对应的第二时间序列数据包括：

根据所述历史交易数据，获得所述待预测时刻对应的待检测的第二时间序列数据；

对所述待检测的第二时间序列数据中的每个待测样本数据进行异常检测；

若判断获知所述待检测的第二时间序列数据中的待测样本数据存在异常，则根据异常处理规则对所述待检测的第二时间序列数据进行处理，获得所述第二时间序列数据。

4.根据权利要求3所述的方法，其特征在于，所述对所述待检测的第二时间序列数据中的每个待测样本数据进行异常检测包括：

根据所述历史交易数据，获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据；

根据每个所述待测样本数据对应的预测时间序列数据和预测模型，获得每个所述待测样本数据对应的预测值；其中，所述预测模型是根据自回归积分滑动平均模型预先建立的；

根据每个所述待测样本数据与对应的预测值的差值和预设阈值，判断每个所述待测样本数据是否异常。

5.根据权利要求4所述的方法，其特征在于，所述根据异常处理规则对所述待检测的第二时间序列数据进行处理，获得所述第二时间序列数据包括：

若判断获知异常的待测样本数据不连续，则使用所述异常的待测样本数据对应的预测值替换所述异常的待测样本数据；

若判断获知所述异常的待测样本数据连续且不稳定，则使用所述异常的待测样本数据对应的预测值替换所述异常的待测样本数据；

若判断获知所述异常的待测样本数据连续且稳定，则在所述第二时间序列数据中保留所述异常的待测样本数据。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述根据所述第一时间序列数据，获得所述待预测时刻的交易量基准值包括：

7.一种周期性时间的交易量预测装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，还包括：

第二数据获得模块，用于根据所述历史交易数据获得所述待预测时刻对应的第二时间序列数据；其中，所述第二时间序列数据中的每个第二样本数据具有相同的交易量日期属性；

划分模块，用于将所述第二时间序列数据划分为训练集和测试集；

建立模块，用于根据所述训练集和差分自回归移动平均模型，建立待验证差分值预测模型；

验证模块，用于根据所述测试集对所述待验证交易量预测模型进行验证，并将通过验证的所述待验证差分值预测模型作为所述待预测时刻对应的差分值预测模型；

获得模块，用于根据所述第二时间序列数据和所述差分值预测模型，获得所述交易量差分值。

9.根据权利要求8所述的装置，其特征在于，所述第二数据获得模块包括：

获得单元，用于根据所述历史交易数据，获得与所述待预测时刻对应的待检测的第二时间序列数据；

检测单元，用于对所述待检测的第二时间序列数据中的每个待测样本数据进行异常检测；

处理单元，用于在判断获知所述待检测的第二时间序列数据中的待测样本数据存在异常之后，根据异常处理规则对所述待检测的第二时间序列数据进行处理，获得所述第二时间序列数据。

10.根据权利要求9所述的装置，其特征在于，所述检测单元包括：

获得子单元，用于根据所述历史交易数据，获得所述待检测的第二时间序列数据的每个待测样本数据对应的预测时间序列数据；

预测子单元，用于根据每个所述待测样本数据对应的预测时间序列数据和预测模型，获得每个所述待测样本数据对应的预测值；其中，所述预测模型是根据自回归积分滑动平均模型预先建立的；

判断子单元，用于根据每个所述待测样本数据与对应的预测值的差值和预设阈值，判断每个所述待测样本数据是否异常。

11.根据权利要求9所述的装置，其特征在于，所述处理单元包括：

第一处理子单元，用于在判断获知异常的待测样本数据不连续之后，使用所述异常的待测样本数据对应的预测值替换所述异常的待测样本数据；

第二处理子单元，用于在判断获知所述异常的待测样本数据连续且不稳定之后，使用所述异常的待测样本数据对应的预测值替换所述异常的待测样本数据；

第三处理子单元，用于在判断获知所述异常的待测样本数据连续且稳定之后，在所述第二时间序列数据中保留所述异常的待测样本数据。

12.根据权利要求7至11任一项所述的装置，其特征在于，所述预测模块具体用于：

13.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至6任一项所述方法的步骤。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。