CN110019420A

CN110019420A - 一种数据序列预测方法及计算设备

Info

Publication number: CN110019420A
Application number: CN201810445781.3A
Authority: CN
Inventors: 陈新杰; 曾嘉; 陈菂; 朱方舟
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2018-05-10
Filing date: 2018-05-10
Publication date: 2019-07-16
Anticipated expiration: 2038-05-10
Also published as: WO2019214455A1; CN110019420B; US20210012152A1

Abstract

本发明实施例提供了一种数据序列预测方法及计算设备，该方法包括：根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离，得到相似距离集合，其中，所述相似距离用于表征两个对象的相似程度，所述历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数；根据所述相似距离集合，通过聚类算法将所述N个对象划分为K个预测对象类，K为正整数，K≤N；对所述K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。实施本发明实施例，通过聚类算法，自动定义预测对象类，效率高且更加准确。

Description

一种数据序列预测方法及计算设备

技术领域

本发明涉及大数据技术领域，尤其涉及一种数据序列预测方法及计算设备。

背景技术

对象的数据序列的预测，例如，产品需求预测，指为保证及时满足客户的需求，预测各个产品(包括整机、半成品、采购件等)的需求，以指导整机或半成品的提前加工、采购件的提前采购。对于某些制造公司来说，整机由半成品和采购件组装而成，整机、半成品、采购件之间存在固定和非固定的产品层次结构。其中，固定的产品层次结构是由固定的产品配置清单决定，例如，一个机箱(半成品)需要的电源背板是由固定的电源连接器、电阻和电容组成。非固定的产品层次结构是由客户订单决定的，例如一个服务器(整机)的订单会选择配置2G的内存或4G的内存。

产品的需求预测需要考虑两个方面的内容，一个是预测准确率，即需求预测值和需求真实值之间层差异；另一个是预测一致性，即客户需求通过订单向公司采购整机，整机需要一系列的半成品和采购件组成，需要保证半成品的预测值、采购件的预测值、整机的预测值之间的一致性，避免一种产品(例如第一采购件)预测过多，导致多余的第一采购件无法消耗；或者一个产品预测过少，影响半成品或整机的生产，最终影响订单的交付。

如图1所示的现有技术中数据预测方法的示意性说明图。为保证产品之间预测一致性，首先需要人工定义预测对象类，将整机、半成品、采购件基于历史需求与产品层次结构进行归类，其次，对于同一预测对象类内的预测层级的产品的需求进行预测，输出该预测对象类内预测层级的产品的预测需求值，进而，基于产品之间的层次结构进行拆解或集成加总，对该预测对象类内调整层级的产品进行一致性调整。

然而，上述数据预测方法还需要人工定义对应的预测对象类，大大降低了应用的便利性，当产品的数量巨大时，通过人工对产品进行分类效率低。

发明内容

本发明实施例提供了一种数据序列预测方法，能够通过聚类算法自动定义预测对象类，效率高且更加准确。

第一方面，本申请实施例提供了一种数据序列预测方法，包括：计算设备或数据序列预测系统根据N个对象的历史数据序列计算该N个对象中每两个对象之间的相似距离得到相似距离集合；根据该相似距离集合，通过聚类算法将N个对象划分为K个预测对象类；进而，对该K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。其中，相似距离用于表征两个对象的相似程度，历史数据序列包括按照预设规律排列的多个数据，N为大于1正整数；K为正整数，K≤N。

相对于现有技术中，人工定义对象类，本申请实施例中，通过聚类算法自动定义预测对象类，效率高且更加准确。

需要说明的是，本申请各个实施例中数据序列预测方法的执行主体可以是计算设备或数据序列预测系统，以下以计算设备为例来说明。

在一种可能的实现方式中，计算设备根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离，得到相似距离集合的一种实施方式可以是：计算设备根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的数据相似距离；计算所述N个对象中每两个对象之间的层次相似距离；进而，根据所述N个对象中每两个对象之间的数据相似距离和层次相似距离，得到所述相似距离集合，所述相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。

其中，所述数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度，所述层次相似距离用于表征两个对象在层次结构中所在层级的相似程度。

本申请实施例中，通过对象之间的数据相似距离和层次相似距离表征对象间相似距离，基于该相似距离进行分类更加准确。

在又一种可能的实现方式中，相似距离集合包括对象i和对象j的相似距离，

对象i和对象j为所述N个对象中的任意两个对象，所述对象i与所述对象j之间的相似距离可以通过下面公式计算：

其中，y_i为所述对象i的历史数据序列，y_j为所述对象j的历史数据序列；所述d_cor(y_i,y_j)为所述对象i与所述对象j之间的数据相似距离，所述d_dis(y_i,y_j)为所述对象i与所述对象j的层次相似距离。

在又一种可能的实现方式中，d_cor(y_i,y_j)的计算公式可以为：

其中，所述Cor(y_i,y_j)为所述对象i和所述对象j的皮尔逊相关性值；y_it为所述对象i的历史数据序列中第t个数据；y_jt为所述对象j的历史数据序列中第t个数据，t为正整数，t≤Q；Q为所述对象i中历史数据序列包含数据的个数，为正整数。

在又一种可能的实现方式中，该N个对象的层次结构为树形结构；其中，d_dis(y_i,y_j)为对象i在所述树形结构中节点位置所属层级与所述对象j在所述树形结构中节点位置所属的层级之差。

在又一种可能的实现方式中，所述第一预测对象类为所述至少一个预测对象类中任意一个预测对象类；计算设备对所述第一预测对象类中所包含对象的未来数据序列进行预测的一种实施方式可以是：计算设备根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式，根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式，进而，根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列。其中，该第一预测对象类的历史共同数据模式用于表示所述第一预测对象类中所有对象的历史数据序列的所包含的共同特征。

本申请实施例中，在对同一预测对象类中对象的未来数据序列进行预测时，通过抽取历史数据模式、预测未来数据模式、进而根据未来数据模式还原出未来数据序列，提升了数据序列预测一致性和预测准确性。

在又一种可能的实现方式中，所述第一预测对象类包括M个对象，M≤N，M为正整数，所述M个对象中每个对象的历史数据序列包括T个数据，T为大于1的正整数；

所述计算设备根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式的一种实施方式可以是：计算设备将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，得到T×T阶的第一矩阵，其中，所述第一矩阵的逆矩阵为正交矩阵，所述第一矩阵的每一行数据组成一个历史数据模式；进而，从所述第一矩阵抽取出第1至第L个历史数据模式作为所述第一预测对象类的历史共同数据模式，L为正整数，L≤T。

本申请实施例中，提供了一种历史共同数据模式的求解方法，以实现从N个对象的历史数据序列中抽取出可以表达第一预测对象类中所有对象的历史数据序列的共同特征的历史共同数据模式。

在又一种可能的实现方式中，所述M个对象中每个对象的未来数据序列包括H个数据，H为正整数；所述计算设备根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式的第一种实施方式可以是：

计算设备根据所述第一预测对象类的历史共同数据模式训练出H个数据模式模型，该H个数据模式模型中的第k数据模式模型用于预测所述第一预测对象类的未来数据模式所组成的第二矩阵中第k列数据，k为正整数，k≤H，该第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征；

将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V₁中第T列至第T-p+1列数据输入到所述H个数据模式模型中的第k数据模式模型，预测出所述第二矩阵中第k列数据，p为正整数，1＜p＜T，所述第三矩阵V₁的每一行组成一个历史共同数据模式；

将所述H个数据模式模型所预测出的数据组合得到所述第二矩阵所述第二矩阵的每一行数据组成一个未来数据模式。

本申请实施例中，提供了一种基于历史共同数据模式的未来数据模式的预测方式。

在又一种可能的实现方式中，所述M个对象中每个对象的未来数据序列包括H个数据，H为正整数；所述计算设备根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式的第二种实施方式可以是：

计算设备根据所述第一预测对象类的历史共同数据模式训练出数据模式模型；

将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V₁中第T-H+k列至第T-H+k-p+1列数据输入到所述数据模式模型，预测出所述第一预测对象类的未来数据模式所组成的第二矩阵中第k列数据，k、p为正整数，k≤H，T-H+k-p≥1；所述第三矩阵V₁的每一行组成一个历史共同数据模式；所述第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征；

将k依次取1至H时所预测出的数据进行组合得到所述第二矩阵所述第二矩阵的每一行数据组成一个未来数据模式。

本申请实施例中，提供了一种基于历史共同数据模式的未来数据模式的预测方式。仅仅需要训练一个数据模式模型，大大减少模型的的训练，提升计算效率。

在又一种可能的实现方式中，计算设备将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，所述第五矩阵D为对角矩阵；计算设备根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列的一种实施方式可以是：其中，为所述第一预测对象类所包含对象的未来数据序列组成的矩阵；所述U₁为所述第四矩阵U的第1至L列数据组成的矩阵，所述D₁为所述第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。

本申请实施例中，提供了一种基于未来数据模式预测对象的未来数据序列的方式，简便。快捷。

在又一种可能的实现方式中，作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小，L可以选定为所述第五矩阵D中大于预设阈值的元素的个数，通过减少历史数据模式的个数减少运算量。

第二方面，本申请实施例提供了一种计算设备，包括：

距离计算单元，用于根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离，得到相似距离集合，其中，相似距离用于表征两个对象的相似程度，历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数；

对象分类单元，用于根据相似距离集合，通过聚类算法将N个对象划分为K个预测对象类；K为正整数，K≤N；

预测单元，用于对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。

在一种可能的实现方式中，距离计算单元具体用于：

根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离；数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度；

计算N个对象中每两个对象之间的层次相似距离，层次相似距离用于表征两个对象在层次结构中所在层级的相似程度；

根据N个对象中每两个对象之间的数据相似距离和层次相似距离，得到相似距离集合，相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。

在又一种可能的实现方式中，对象i和对象j为N个对象中的任意两个对象，对象i与对象j之间的相似距离通过下面公式计算：

其中，y_i为对象i的历史数据序列，y_j为对象j的历史数据序列；d_cor(y_i,y_j)为对象i与对象j之间的数据相似距离，d_dis(y_i,y_j)为对象i与对象j的层次相似距离。

在又一种可能的实现方式中，d_cor(y_i,y_j)的计算公式为：

其中，Cor(y_i,y_j)为对象i和对象j的皮尔逊相关性值；y_it为对象i的历史数据序列中第t个数据；y_jt为对象j的历史数据序列中第t个数据，t为正整数，t≤Q；Q为对象i中历史数据序列包含数据的个数，为正整数。

可选地，N个对象的层次结构为树形结构；其中，d_dis(y_i,y_j)为对象i在树形结构中节点位置所属层级与对象j在树形结构中节点位置所属的层级之差。

在又一种可能的实现方式中，第一预测对象类为至少一个预测对象类中任意一个预测对象类；

预测单元用于对第一预测对象类所包含对象的未来数据序列进行预测，包括用于：

根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式，第一预测对象类的历史共同数据模式用于表示第一预测对象类中所有对象的历史数据序列的所包含的共同特征；

根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式；

根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列。

在又一种可能的实现方式中，第一预测对象类包括M个对象，M≤N，M为正整数，M个对象中每个对象的历史数据序列包括T个数据，T为大于1的正整数；

预测单元根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式，包括用于：

将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，得到T×T阶的第一矩阵，其中，第一矩阵的逆矩阵为正交矩阵，第一矩阵的每一行数据组成一个历史数据模式；

从第一矩阵抽取出第1至第L个历史数据模式作为第一预测对象类的历史共同数据模式，L为正整数，L≤T。

在又一种可能的实现方式中，M个对象中每个对象的未来数据序列包括H个数据，H为正整数；

预测单元根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式，包括用于：

根据第一预测对象类的历史共同数据模式训练出H个数据模式模型，H个数据模式模型中的第k数据模式模型用于预测第一预测对象类的未来数据模式所组成的第二矩阵中第k列数据，k为正整数，k≤H，第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征；

将第一预测对象类的历史共同数据模式所组成的第三矩阵V₁中第T列至第T-p+1列数据输入到H个数据模式模型中的第k数据模式模型，预测出第二矩阵中第k列数据，p为正整数，1＜p＜T，第三矩阵V₁的每一行组成一个历史共同数据模式；

将H个数据模式模型所预测出的数据组合得到第二矩阵第二矩阵的每一行数据组成一个未来数据模式。

在又一种可能的实现方式中，M个对象中每个对象的未来数据序列包括H个数据，H为正整数；预测单元根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式，包括用于：

根据第一预测对象类的历史共同数据模式训练出数据模式模型；

将第一预测对象类的历史共同数据模式所组成的第三矩阵V₁中第T-H+k列至第T-H+k-p+1列数据输入到数据模式模型，预测出第一预测对象类的未来数据模式所组成的第二矩阵中第k列数据，k、p为正整数，k≤H，T-H+k-p≥1；第三矩阵V₁的每一行组成一个历史共同数据模式；第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征；

将k依次取1至H时所预测出的数据进行组合得到第二矩阵第二矩阵的每一行数据组成一个未来数据模式。

在又一种可能的实现方式中，预测单元用于将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，第五矩阵D为对角矩阵；

预测单元根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列，用于包括：

其中，为第一预测对象类所包含对象的未来数据序列组成的矩阵；U₁为第四矩阵U的第1至L列数据组成的矩阵，D₁为第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。

在又一种可能的实现方式中，作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小，L可以选定为第五矩阵D中大于预设阈值的元素的个数，通过减少历史数据模式的个数减少运算量。

第三方面，本申请实施例还提供了一种计算设备，包括处理器和存储器，处理器连接到存储器，处理器用于调用存储器存储的程序代码执行：

根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离，得到相似距离集合，其中，相似距离用于表征两个对象的相似程度，历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数；

根据相似距离集合，通过聚类算法将N个对象划分为K个预测对象类；K为正整数，K≤N；

对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。

在一种可能的实现方式中，处理器执行根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离，得到相似距离集合包括执行：

根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离，数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度；

在又一种可能的实现方式中，

对象i和对象j为N个对象中的任意两个对象，对象i与对象j之间的相似距离通过下面公式计算：

在又一种可能的实现方式中，d_cor(y_i,y_j)的计算公式为：

在又一种可能的实现方式中，N个对象的层次结构为树形结构；其中，d_dis(y_i,y_j)为对象i在树形结构中节点位置所属层级与对象j在树形结构中节点位置所属的层级之差。

在又一种可能的实现方式中，第一预测对象类为至少一个预测对象类中任意一个预测对象类；处理器执行对第一预测对象类中所包含对象的未来数据序列进行预测，包括执行：

处理器执行根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式，包括执行：

在又一种可能的实现方式中，M个对象中每个对象的未来数据序列包括H个数据，H为正整数；处理器执行根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式包括执行：

在又一种可能的实现方式中，处理器执行将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，第五矩阵D为对角矩阵；

根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列，具体包括：

第四方面，本发明实施例还提供了一种数据序列预测系统，该数据序列预测系统包括但不限于：

距离计算模块，用于根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离，得到相似距离集合，其中，相似距离用于表征两个对象的相似程度，历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数；

对象分类模块，用于根据相似距离集合，通过聚类算法将N个对象划分为K个预测对象类；K为正整数，K≤N；

预测模块，用于对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。

可选地，该数据序列预测系统还可以包括数据输入模块和/或结果输出模块。其中，数据输入模块用于：接收数据，并将数据转换为预测模块需要的数据格式，该数据可以包括N个对象的历史数据序列。结果输出模块用于：输出预测模块的预测结果。

在一种可能的实现方式中，距离计算模块具体用于：

在又一种可能的实现方式中，d_cor(y_i,y_j)的计算公式为：

预测模块用于对第一预测对象类所包含对象的未来数据序列进行预测，包括用于：

预测模块根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式，包括用于：

预测模块根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式，包括用于：

在又一种可能的实现方式中，M个对象中每个对象的未来数据序列包括H个数据，H为正整数；预测模块根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式，包括用于：

在又一种可能的实现方式中，预测模块用于将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，第五矩阵D为对角矩阵；

预测模块根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列，用于包括：

第五方面，本发明实施例还提供了一种计算机存储介质，其特征在于，所述计算机存储介质用于计算机软件指令，所述计算机软件指令当被计算机执行时使所述计算机执行如第一方面所述的任意一种数据序列预测方法。

第六方面，本发明实施例还提供了一种计算机程序，所述计算机程序包括计算机软件指令，所述指令当被计算机执行时使计算机执行第一方面所述的任一种数据序列预测方法。

综上，本申请实施例根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离，得到相似距离集合，该相似距离用于表征两个对象的相似程度；进而，根据得到相似距离集合，通过聚类算法将N个对象划分为K个预测对象类；再对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。实施本发明实施例，通过聚类算法，自动定义预测对象类，效率高且更加准确。

而且，在对同一预测对象类中对象的未来数据序列进行预测时，通过抽取历史数据模式、预测未来数据模式、进而根据未来数据模式还原出未来数据序列，提升了数据序列预测一致性和预测准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为现有技术中数据预测方法的示意性说明图；

图2为本申请实施例提供的一种产品层次结构的示意性说明图；

图3为本申请实施例提供的一种数据序列预测方法的应用场景示意图；

图4为本申请实施例提供的一种数据序列预测系统的架构示意图；

图5为本申请实施例提供的一种数据序列预测方法的流程示意图；

图6为本申请实施例提供的一种预测对象类的示意性说明图；

图7为本申请实施例提供的一种对第一预测对象类中对象的未来数据序列进行预测的方法的流程示意图；

图8为本申请实施例提供的第一种根据历史共同数据模式预测未来数据模式的原理示意图；

图9为本申请实施例提供的第二种根据历史共同数据模式预测未来数据模式的原理示意图；

图10为本申请实施例提供的一种计算设备的结构示意图；

图11为本申请实施例提供的另一种计算设备的结构示意图。

具体实施方式

下面将结合附图对现有技术或者本发明实施例中的技术方案进行清楚、完整地描述。

下面介绍本发明实施例涉及的概念、术语。

本申请实施例中包括多个对象(object)，对象作为本申请实施例中研究对象，可以是被销售或采购的物体(如产品)，也可以是其他对象，本申请实施例不作限定。可选地，该多个对象之间可以存在层次结构，该层次结构可以是树形结构。

本申请实施例中，树形结构指对象之间存在着“一对多”的对应关系。树形结构可以表示对象之间的层次关系。

数据序列，指按照预设规律排列的多个数据。可选地，该数据序列可以是按照时间顺序排列的多个数据。

历史数据序列，指已获得的数据序列。

未来数据序列，指待预测的数据序列。

应理解，对于按照时间顺序排列的数据序列来说，历史数据序列可以是第一时间点之前的数据序列，未来数据序列可以是第一时间点之后的数据序列。

相似距离，表征两个对象之间历史数据的相似程度，相似距离越小，越可能被划分到同一对象类。

聚类算法，可以是基于距离的聚类算法，把多个对象集分割成不同的类或簇，使得同一个类内的对象的相似性尽可能大，同时不在同一个类中的对象的差异性也尽可能地大。

对象类：是指有一定关系的多个产品的集合。本申请实施例中，对象类为根据多个对象的历史数据序列通过聚类算法将该多个对象划分的类。

一致性预测：指对于同一个对象类，预测时考虑各个对象类中的对象间的层次关系，保证各个对象类的预测数据的一致性。

固定层次结构，指一个对象对应一个或多个固定的对象。例如，一个半成品又固定的生产配置清单，例如，一个机箱需要的电源背板是由固定的电源连接器、电阻、电容组成，则机箱与电源连接器、电阻、电容存在固定层次结构。

非固定层次结构，指一个对象对应一个或多个非固定的对象。例如，一个服务器的订单会选择配置4G的内容或2G的内存，则服务器与2G的内存、4G的内存存在非固定层次结构。

对角矩阵：只有对角线上的值非0，其他值为0的矩阵。

自回归积分滑动平均模型(Autoregressive Integrated Moving AverageModel，简称ARIMA)，是由博克思(Box)和詹金斯(Jenkins)提出一种时间序列预测方法，是指将非平稳时间序列转化为平稳时间序列，然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。

下面介绍本申请数据序列预测方法可应用的一种场景：

本发明数据序列预测方法可以应用在多个时间序列，且序列之间存在一定关系的预测问题中，例如供应链的多产品的需求预测问题，多地区(市及下属区)的电力预测问题等。下面以具有树形结构的多个产品的需求预测为例来说明本申请数据序列预测方法的应用场景。

请参阅图2，图2是本申请实施例提供的一种产品层次结构的示意性说明图。

整机(Pick to Order，PTO)：是指用于直接销售的完整产品，例如一台服务器、计算机等，该整机可以是图2中产品1。

半成品(Assembled Item，AI)：是指需要通过工厂进行加工的中间件，该半成品可以是图2中，产品2、产品3、产品4、产品5、产品6。

采购件(Purchased Item，PI)：是指直接通过采购获取的产品，可以是图2中产品7、产品8、产品9、产品10、产品11、产品12。

如图3的应用场景图，体现了本申请数据序列预测方法在企业履行客户需求中的功能。由于采购件以及半成品存在采购周期和生产周期的限制，需要通过需求预测进行提前储备，以匹配客户的需求周期，按期履行客户的需求，基本步骤如下：

步骤S301：客户将需求信息(例如订单信息)传递市场计划或者订单管理部门

步骤S302：市场计划或者订单管理部门将历史以及未来相关订单信息输入到需求预测系统中。

步骤S303：需求预测系统对采购间，半成品等产品的未来需求进行预测，将对采购件的需求预测值传递给供应商进行采购，将对半成品需求预测值传递给工厂进行提前加工制造。

步骤S304：工厂进行加工制造，履行订单将产品交付给客户。

需求预测系统对未来需求进行预测的方法可以参见下述数据序列预测方法实施例中相关描述，本申请实施例不再赘述。

请参阅图4，图4是本申请实施例提供的一种数据序列预测系统的架构示意图，该数据序列预测系统可以应用于一个或多个计算设备，该数据序列预测系统可以包括：

数据输入模块41，用于接收数据，并将数据转换为预测模块需要的数据格式，该数据可以包括N个对象的历史数据序列。

距离计算模块42，用于根据N个对象的历史数据序列计算该N个对象中每两个对象之间的相似距离，得到相似距离集合，其中，相似距离用于表征两个对象的相似程度，历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数。

对象分类模块43，用于根据所述相似距离集合，通过聚类算法将所述N个对象划分为K个预测对象类；K为正整数，K≤N。

预测模块44，用于根据N个对象的历史数据序列对K个对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。

结果输出模块45，用于输出预测模块的预测结果。

需要说明的是，虽然图4给出了数据输入模块41、结果输出模块45，但数据输入模块41和/或结果输出模块45不是数据预测系统必须的组成部分。

还需要说明的是，数据序列预测系统可以应用于各种场景，例如上述需求预测系统即为数据序列预测系统在产品需求预测场景中的一种表达形式。上述各个模块可以分别设置于计算设备中，也可以设置于同于计算设备中，本申请实施例不作限定。各个模块或单元功能的具体实现，可以参见下述数据序列预测方法实施例中相关描述，本申请实施例不再赘述。

下面介绍本发明涉及的一种数据序列预测方法，该方法可以应用于上述数据预测系统，也可以应用于一个或多个计算设备中。本申请实施例以数据序列预测方法应用于一个计算设备为例来说明。

应理解，本申请实施例中，各个对象对应一个历史数据序列，该历史数据序列包括按照预设规律排列的多个数据。

可选地，该预设规律可以是时间先后，数据序列为对象随时间推移而形成的数据序列。历史数据序列为对象第一时间点之前按照时间先后依次生成的多个数据。未来数据序列为预测的对象在第一时间点之后按照时间先后排列的一个或多个数据。

例如，对象为产品，对象的历史数据序列为产品在过去的一个年内每月的需求数量。该数据序列预测方法应用于产品需求预测，可以预测出各个产品在未来一段时间内每月的需求数量。可以理解，产品之间可以存在结构层次。例如，请参阅图2所示的产品的层次结构的示意性说明图。

又例如，对象为地区，该地区可以中国各个省、市、县、区等，历史数据序列为地区在过去的一个月内每天的电力需求瓦数。该数据序列预测方法应用于电力需求预测，可以预测出各个地区在未来一段时间内每天的需求瓦数。可以理解，地区之间存在固定的层次结构。一个省可以包括多个市，一个市可以包括多个区、县等。

需要说明的是，对象的历史数据序列还可以是其他规律，本发明实施例不作限定。

请参阅图5，图5是本申请实施例提供的一种数据序列预测方法的流程示意图，该数据序列预测方法包括但不限于以下部分或全部步骤：

步骤S1：根据N个对象的历史数据序列计算该N个对象中每两个对象之间的相似距离，得到相似距离集合。

其中，相似距离用于表征两个对象的相似程度。历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数。

可以理解，相似距离集合可以包括N(N-1)/2个相似距离值。

对象i和对象j分别为N个对象中任意两个不同的对象，i，j为正整数，且i≤N，j≤N，i≠j。相似距离集合包括对象i和对象j的相似距离。

对象i的历史数据序列可以表示为y_i＝[y_i1 y_i2 … y_iT]。

对象j的历史数据序列可以表示为y_j＝[y_j1 y_j2 … y_jT]。

其中，T为大于1的正整数。

本发明实施例中，对象i和对象j的相似距离可以具有以下两种表达方式。

第一表达方式：

N个对象之间可以存在层次结构。可以通过数据相似距离d_cor(y_i,y_j)和层次相似距离d_dis(y_i,y_j)来表示对象i和对象j的相似距离d(y_i,y_j)。具体地，计算设备根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离，以及计算该N个对象中每两个对象之间的层次相似距离；进而，根据N个对象中每两个对象之间的数据相似距离和层次相似距离，得到相似距离集合，该相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。其中，数据相似距离用于表征两个对象分别对应的历史数据序列之间的相似程度。层次相似距离用于表征两个对象层次结构中所在的层级的相似程度。

可选地，计算设备计算对象i和对象j之间的相似距离的一种实施方式可以是：

对象i与对象j的数据相似距离可以表示为：

其中，公式(1)中，Cor(y_i,y_j)为所述第一对象和所述第二对象的皮尔逊相关性值，Cor(y_i,y_j)可以表示为：

其中，y_it为所述对象i的历史数据序列中第t个数据；y_jt为所述对象j的历史数据序列中第t个数据，t为正整数，t≤T。

可选地，N个对象的层次结构为树形结构，对象i与对象j的层次相似距离d_dis(y_i,y_j)可以是对象i在该树形结构中节点位置所属层级与对象j在该树形结构中节点位置所属的层级之差。

如图4所示，产品1和产品2之间的层次相似距离为1，产品1和产品3之间的层次相似距离为2。

进而，对象i与对象j的层次相似距离可以表示为：

d(y_i,y_j)＝f(d_dis(y_i,y_j))*d_cor(y_i,y_j) (3)

其中，i、j为正整数，且i≤N，j≤N，i≠j。

第二表达方式：

N个对象之间可以不存在层次结构或者N个对象之间存在层次结构，但在计算相似距离时可以不考虑。可以通过数据相似距离d_cor(y_i,y_j)单独来表示对象i和对象j的相似距离。

d(y_i,y_j)＝d_cor(y_i,y_j) (4)

对象i与对象j的数据相似距离d_cor(y_i,y_j)的计算可以参见上述第一表达方式中相关描述，本发明实施例不再赘述。

应理解，通过上述对象i和对象j的相似距离的求解方法可以得到相似距离集合。

步骤S2：根据该相似距离集合，通过聚类算法将该N个对象划分为K个预测对象类。其中，K为正整数，K＜N。

例如，图3所示的产品的层次结构在聚类后划分成图6所示的3个预测对象类，使得具有相近的相似距离的对象划分到同一预测对象类中，分别为第一预测对象类、第二预测对象类和第三预测对象类。

本发明实施例中聚类算法以对象之间的相似距离的远近确定对象所属的类。聚类算法可以包括但不限于K均值聚类算法(K-means)、K中心聚类算法(K-median)、K中心点聚类算法K-center、谱聚类算法(Spectral clustering)、基于密度的聚类算法(Density-based clustering)等。

通过上述聚类算法可以将N个对象划分为K个预测对象类，聚类算法为现有技术，本发明实施例不再赘述。

预测对象类A为K个预测对象类中任意一个预测对象类，对象f为预测对象类A中任意一个对象。一般地，对象f与预测对象类A中对象之间的相似距离小于对象f与预测对象类A之外任意一个对象的相似距离。

步骤S3：对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。

其中，第一预测对象类为至少一个预测对象类中任意一个预测对象类，该第一预测对象类包括M个对象，M≤N，M为正整数。

本申请一实施例中，如图7所示对第一预测对象类中对象的未来数据序列进行预测的方法的流程示意图，该方法可以包括以下步骤：

步骤S31：根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式；

步骤S32：根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式；

步骤S33：根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列。

可选地，步骤S31的一种实施方式可以是：

M个对象的历史数据序列可以组成一个M×T阶的矩阵Y。通过奇异值分解该M×T阶的矩阵Y可以得到T×T阶的第一矩阵V、M×M阶的第四矩阵U、M×T阶的第五矩阵D和。即：

Y＝UDV (5)

其中，矩阵Y中每一行元素表示一个对象的历史数据序列。Y可以表示为：

第一矩阵的逆矩阵V^-1为正交矩阵，第一矩阵V中每一行元素表示一个历史数据模式。任意一个历史数据模式为T个数据组成的数据序列，V可以表示为：

其中，第五矩阵D为对角矩阵，若L＜T＜M，则D可以表示为：

第五矩阵D中对角线上的值d_ii，表示第i个历史数据模式的权重。奇异值分解得到的对角矩阵D对角线上的值以d₁₁最大，随i增大，对角线上的值d_ii减小。当

其中，模式数据矩阵U为正交矩阵，U可以表示为：

第四矩阵U中第i行元素表示M个对象中第i对象在各个历史数据模式上的值。

本发明实施例以T≤M为例来说明，根据公式(5)，可知：

即M个对象中第i对象的历史数据序列中第j个数据为抽取出的各个历史数据模式中第j个数据的加权。一个历史数据模式的整体重要性以D决定，不同对象的重要性更进一步以模式数据矩阵U决定。

并非所有历史数据模式都是预测对象类中对象所共有的，只有部分重要的历史数据模式代表了预测对象类中的历史共同数据模式。由于第五矩阵D中对角线上的值d_ii随i增大而不断减小，因此可以选取第一矩阵中第1至L行历史数据模式作为历史共同数据模式。此时，第一矩阵可以表示为：

可以理解，历史共同数据模式反应了第一预测对象类中所有对象中隐含的共同特征，第一预测对象类中任意一个对象的历史数据序列中各个元素可以表示为历史共同数据模式的线性叠加。

可选地，作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小，L可以选定为第五矩阵D中大于预设阈值的元素的个数，进而通过减少历史数据模式的个数减少运算量。

可选地，选取的L历史数据模式可以组成第三矩阵。同时，抽取模式数据矩阵U中的前L列元素组成矩阵U₁，抽取第五矩阵D中的第1至L行数据中的第1至L列元素组成矩阵D₁，如图2所示，其中U₁、D₁、V₁可以分别表示为：

第三矩阵

需要说明的是，若T≤M，则L≤T；若T＞M，则L≤M。T＞M的情况，Y、U、D、V的表达方式同T≤M类似，本发明实施例不再赘述。

还需要说明的是，L可以等于M，本发明实施例也可以直接将第一矩阵V作为第三矩阵，同时，第四矩阵U作为矩阵U₁，第五矩阵D作为矩阵D₁。

当需要预测的未来数据序列为历史数据序列之后的H个数据时，可以根据第一预测对象类的历史数据模式预测出第一预测对象类的未来数据模式，第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征。第一预测对象类的未来数据模式所组成的第二矩阵可以表示为：

第三矩阵V₁中第r列数据组成的列向量v_r，可以表示为：

v_r＝[v_1,r,v_2,r,…,v_L,r]；其中，r为正整数，r≤T。

预测的第二矩阵中第k列数据组成的列向量可以表示为：

其中，k为正整数，k≤H。

可选地，如图8所示的第一种根据历史共同数据模式预测未来数据模式的原理示意图。计算设备可以根据第一预测对象类的历史共同数据模式训练出H个数据模式模型，该H个数据模式模型中的第k数据模式模型用于预测第一预测对象类的未来数据模式所组成的第二矩阵中第k列数据；将第一预测对象类的历史共同数据模式所组成的第三矩阵V₁中第T列至第T-p+1列数据输入到所述H个数据模式模型中的第k数据模式模型，预测出第二矩阵中第k列数据，p为正整数，1＜p＜T，第三矩阵V₁的每一行组成一个历史共同数据模式；进而，将该H个数据模式模型所预测出的数据组合得到第二矩阵该第二矩阵的每一行数据组成一个未来数据模式。

具体地，步骤S32的一种实施方式可以包括：

步骤S321：建立初始模型：

初始模型可以是线性加权模型，也可以是自回归模型。该初始模型可以表示为：

应理解，初始模型还可以具有其他形式，本申请实施例不作限定。

步骤S322：通过历史共同数据模式中第一部分数据训练该初始模型，得到数据模式模型。

具体地，将第三矩阵V₁中v_s、v_s-1、…、v_s-p+1代入到初始模型，构建关于v_s+k、的损失函数通过使损失函数最小确定初始模型中的参数β_k,0、β_k,1、…、β_k,p，进而，将确定的参数代入到初始模型中，得到数据模式模型。损失函数可以采用平方损失函数，计算初始模型中的参数可以采用最小二乘法或梯度下降法等、本申请实施例不作限定。

其中，历史共同数据模式中第一部分数据为样本数据，该第一部分数据为v_s、v_s-1、…、v_s-p+1，其中，s+k≤T，p为正整数，p≤s。

步骤S323：将历史共同数据模式中第二部分数据代入到数据模式模型，得到未来数据模式。

其中，历史共同数据模式中第二部分数据为测试数据，该第二部分数据为v_T、v_T-1、…、v_T-p+₁。

可以理解，令k取1至H，通过上述方法可以得到H个数据模式模型。

当k＝1时，初始模型通过训练得到第一数据模式模型。该第一数据模式模型为：

将历史数据v_T、v_T-1、…、v_T-p+1输入到该第一数据模式模型确定的可得到

该

当k＝2时，初始模型通过训练得到第二数据模式模型。该第二数据模式模型为：

将历史数据v_T、v_T-1、…、v_T-p+1输入到该第二数据模式模型确定的可得到

该

以此类推，当k＝H时，初始模型通过训练得到第H数据模式模型。该第H数据模式模型为：

该

进而，得到预测的未来数据模式组成的未来矩阵：

其中，预测的未来数据模式中每一行为一个未来数据模式。

可选地，如图9所示的第二种根据历史共同数据模式预测未来数据模式的原理示意图。计算设备可以根据所述第一预测对象类的历史共同数据模式训练出数据模式模型；将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V₁中第T-H+k列至第T-H+k-p+1列数据输入到所述数据模式模型，预测出所述第一预测对象类的未来数据模式所组成的第二矩阵中第k列数据，k、p为正整数，k≤H，T-H+k-p≥1；所述第三矩阵V₁的每一行组成一个历史共同数据模式；进而，将k依次取1至H时所预测出的数据进行组合得到所述第二矩阵所述第二矩阵的每一行数据组成一个未来数据模式。

具体的，步骤S32的另一种实施方式可以是：

步骤S324：建立第一初始模型：

第一初始模型可以是线性加权模型，也可以是自回归模型。该第一初始模型可以表示为：

步骤S325：通过历史共同数据模式中第三部分数据训练该初始模型，得到数据模式模型。

具体地，将历史共同模式矩阵中v_s、v_s-1、…、v_s-p+1代入到第一初始模型，构建关于v_s+H、的损失函数通过使损失函数最小确定初始模型中的参数β_H,0、β_H,1、…、β_H,p，进而，将确定的参数代入到第一初始模型中，得到数据模式模型。损失函数可以采用平方损失函数，计算第一初始模型中的参数可以采用最小二乘法或梯度下降法等、本申请实施例不作限定。

其中，历史共同数据模式中第三部分数据为样本数据，该第三部分数据为vs、vs-1、…、vs-p+1，其中，s+H≤T，p为正整数，p≤s。

步骤S326：将历史共同数据模式中第四部分数据代入到数据模式模型，得到未来数据模式。

可以将第三矩阵V₁中v_T-k+1、v_T-k、…、v_T-p+2-k代入该数据模式模型计算k为正整数，k≤H。

具体地，将v_T v_T-1…v_T-p+1代入数据模式模型可得将v_T-1v_T-2…v_T-p代入数据模式模型可得以此类推，将v_T-H+1v_T-H…v_T-H-p+2代入数据模式模型可得

进而，将组合得到第二矩阵

应理解，该第四矩阵包括L个未来数据模式，未来模式矩阵中每一行元素表示一个未来数据模式。

本发明实施例中，仅仅需要训练一个数据模式模型，即可预测出未来数据模式。

本申请一实施例中，步骤S33的一种实施方式可以是：将矩阵U₁、矩阵D₁和第二矩阵相乘得到M个对象的未来数据矩阵即：

根据公式(8)以及上述U₁、D₁、可得：

其中，未来数据矩阵

未来数据矩阵中，对象i的未来数据序列可以表示为

需要说明的是，当L＝T时，具体可以参见上述相关描述，本申请实施例不再赘述。

还需要说明的是，H可以等于1，未来数据序列可以只包括一个数据。

应理解，计算设备或预测模块可以对K个预测对象类中任意一个或多个预测对象类中对象的未来数据序列进行预测。

采用某一公司多个产品实际的订单数据作为训练集，对产品的未来需求进行预测。实验结果证明，与图1所示现有技术或通过ARIMA模型预测相比，采用本申请数据序列预测方法，其预测准确率和订单满足率分别可以提升7％、5％左右。

其中，预测一致性，用于衡量在一段时间内，订单被满足的比例。该预测一致性可以表示为：

当订单i被满足,则I_i＝1。Q为订单总数。

预测准确性，衡量在一段时间内，预测的未来数据序列和真实的数据序列的相近程度。该预测准确性可以表示为：

其中，n为编码的个数。

现有技术中数据预测系统假定了该多个产品具有固定的产品层次结构，进而基于该固定的产品层次结构对预测值拆解或调整，以保证各个产品之间的预测一致性。当多个产品之间具有非固定的产品层次结构时，上述数据预测方法并不能保证各个产品之间的预测一致性。

本申请实施例，计算设备根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离，得到相似距离集合，该相似距离用于表征两个对象的相似程度；进而，根据得到相似距离集合，通过聚类算法将N个对象划分为K个预测对象类；再对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。实施本发明实施例，通过聚类算法，自动定义预测对象类，效率高且更加准确。

下面介绍本申请实施例中涉及的装置。

请参阅图10，图10是本发明实施例提供的一种计算设备的结构示意图，该计算设备10可以包括：

距离计算单元101，用于根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离，得到相似距离集合，其中，相似距离用于表征两个对象的相似程度，历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数；

对象分类单元102，用于根据相似距离集合，通过聚类算法将N个对象划分为K个预测对象类；K为正整数，K≤N；

预测单元103，用于对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。

本申请一实施例中，距离计算单元101具体用于：

本申请一实施例中，对象i和对象j为N个对象中的任意两个对象，对象i与对象j之间的相似距离通过下面公式计算：

可选地，d_cor(y_i,y_j)的计算公式为：

本申请一实施例中，第一预测对象类为至少一个预测对象类中任意一个预测对象类；

预测单元103用于对第一预测对象类所包含对象的未来数据序列进行预测，包括用于：

本申请一实施例中，第一预测对象类包括M个对象，M≤N，M为正整数，M个对象中每个对象的历史数据序列包括T个数据，T为大于1的正整数；

预测单元103根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式，包括用于：

本申请一实施例中，M个对象中每个对象的未来数据序列包括H个数据，H为正整数；

预测单元103根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式，包括用于：

本申请一实施例中，M个对象中每个对象的未来数据序列包括H个数据，H为正整数；预测单元103根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式，包括用于：

本申请一实施例中，预测单元103用于将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，第五矩阵D为对角矩阵；

预测单元103根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列，用于包括：

本申请一实施例中，作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小，L可以选定为第五矩阵D中大于预设阈值的元素的个数，通过减少历史数据模式的个数减少运算量。

需要说明的是，各个单元的实现还可以对应参照方法实施例的相应描述，本申请实施例不再赘述。

请参阅图11，图11是本申请实施例提供的另一种计算设备的结构示意图该计算设备11包括处理器111和存储器112。处理器111通过总线113连接到存储器112。

存储器112可以包括只读存储器和随机存取存储器，并向处理器111提供指令和数据。存储器112的一部分还可以包括非易失性随机存取存储器(NVRAM)。

可选地，计算设备11还可以包括至少一个通信接口，该通信接口用于实现计算设备11与终端、服务器或其他计算设备等之间的数据交换。

处理器111可以是中央处理单元(Central Processing Unit，CPU)，该处理器111还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

处理器111用于调用存储器112存储的程序代码执行：

本申请一实施例中，处理器111执行根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离，得到相似距离集合包括执行：

本申请一实施例中，d_cor(y_i,y_j)的计算公式为：

本申请一实施例中，N个对象的层次结构为树形结构；其中，d_dis(y_i,y_j)为对象i在树形结构中节点位置所属层级与对象j在树形结构中节点位置所属的层级之差。

本申请一实施例中，第一预测对象类为至少一个预测对象类中任意一个预测对象类；处理器111执行对第一预测对象类中所包含对象的未来数据序列进行预测，包括执行：

处理器111执行根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式，包括执行：

本申请一实施例中，M个对象中每个对象的未来数据序列包括H个数据，H为正整数；处理器111执行根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式包括执行：

本申请一实施例中，处理器111执行将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，第五矩阵D为对角矩阵；

需要说明的是，各个单元的实现还可以对应参照上述方法实施例中的相应描述，本申请实施例不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本发明实施例装置中的模块可以根据实际需要进行合并、划分和删减。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种数据序列预测方法，其特征在于，包括：

根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离，得到相似距离集合，其中，所述相似距离用于表征两个对象的相似程度，所述历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数；

根据所述相似距离集合，通过聚类算法将所述N个对象划分为K个预测对象类；K为正整数，K≤N；

对所述K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。

2.如权利要求1所述的数据序列预测方法，其特征在于，所述根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离，得到相似距离集合包括：

根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的数据相似距离，所述数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度；

计算所述N个对象中每两个对象之间的层次相似距离，所述层次相似距离用于表征两个对象在层次结构中所在层级的相似程度；

根据所述N个对象中每两个对象之间的数据相似距离和层次相似距离，得到所述相似距离集合，所述相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。

3.如权利要求2所述的数据序列预测方法，其特征在于，对象i和对象j为所述N个对象中的任意两个对象，所述对象i与所述对象j之间的相似距离通过下面公式计算：

4.如权利要求3所述的数据序列预测方法，其特征在于，所述d_cor(y_i,y_j)的计算公式为：

5.如权利要求3所述的数据序列预测方法，其特征在于，所述N个对象的层次结构为树形结构；其中，所述d_dis(y_i,y_j)为所述对象i在所述树形结构中节点位置所属层级与所述对象j在所述树形结构中节点位置所属的层级之差。

6.如权利要求1-5任意一项权利要求所述的数据序列预测方法，其特征在于，所述第一预测对象类为所述至少一个预测对象类中任意一个预测对象类；

对所述第一预测对象类中所包含对象的未来数据序列进行预测，包括：

根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式，所述第一预测对象类的历史共同数据模式用于表示所述第一预测对象类中所有对象的历史数据序列的所包含的共同特征；

根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式；

根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列。

7.如权利要求6所述的数据序列预测方法，其特征在于，所述第一预测对象类包括M个对象，M≤N，M为正整数，所述M个对象中每个对象的历史数据序列包括T个数据，T为大于1的正整数；

所述根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式，包括：

将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，得到T×T阶的第一矩阵，其中，所述第一矩阵的逆矩阵为正交矩阵，所述第一矩阵的每一行数据组成一个历史数据模式；

从所述第一矩阵抽取出第1至第L个历史数据模式作为所述第一预测对象类的历史共同数据模式，L为正整数，L≤T。

8.如权利要求7所述的数据序列预测方法，其特征在于，所述M个对象中每个对象的未来数据序列包括H个数据，H为正整数；所述根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式包括：

根据所述第一预测对象类的历史共同数据模式训练出H个数据模式模型，所述H个数据模式模型中的第k数据模式模型用于预测所述第一预测对象类的未来数据模式所组成的第二矩阵中第k列数据，k为正整数，k≤H，所述第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征；

9.如权利要求7所述的数据序列预测方法，其特征在于，所述M个对象中每个对象的未来数据序列包括H个数据，H为正整数；所述根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式包括：

根据所述第一预测对象类的历史共同数据模式训练出数据模式模型；

10.如权利要求8或9所述的数据序列预测方法，其特征在于，所述将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，所述第五矩阵D为对角矩阵；

所述根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列，具体包括：

其中，为所述第一预测对象类所包含对象的未来数据序列组成的矩阵；所述U₁为所述第四矩阵U的第1至L列数据组成的矩阵，所述D₁为所述第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。

11.如权利要求10所述的数据序列预测方法，其特征在于，所述L为所述第五矩阵D中大于预设阈值的元素的个数。

12.一种计算设备，其特征在于，包括：

距离计算单元，用于根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离，得到相似距离集合，其中，所述相似距离用于表征两个对象的相似程度，所述历史数据序列包括按照预设规律排列的多个数据，N为大于1的正整数；

对象分类单元，用于根据所述相似距离集合，通过聚类算法将所述N个对象划分为K个预测对象类；K为正整数，K≤N；

预测单元，用于对所述K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。

13.如权利要求12所述的计算设备，其特征在于，所述距离计算单元具体用于：

根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的数据相似距离；所述数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度；

14.如权利要求13所述的计算设备，其特征在于，对象i和对象j为所述N个对象中的任意两个对象，所述对象i与所述对象j之间的相似距离通过下面公式计算：

15.如权利要求14所述的计算设备，其特征在于，所述d_cor(y_i,y_j)的计算公式为：

16.如权利要求14所述的计算设备，其特征在于，所述N个对象的层次结构为树形结构；其中，所述d_dis(y_i,y_j)为所述对象i在所述树形结构中节点位置所属层级与所述对象j在所述树形结构中节点位置所属的层级之差。

17.如权利要求12-16任意一项权利要求所述的计算设备，其特征在于，所述第一预测对象类为所述至少一个预测对象类中任意一个预测对象类；

所述预测单元用于对所述第一预测对象类所包含对象的未来数据序列进行预测，具体用于：

18.如权利要求17所述的计算设备，其特征在于，所述第一预测对象类包括M个对象，M≤N，M为正整数，所述M个对象中每个对象的历史数据序列包括T个数据，T为大于1的正整数；

所述预测单元根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式，包括用于：

19.如权利要求18所述的计算设备，其特征在于，所述M个对象中每个对象的未来数据序列包括H个数据，H为正整数；

所述预测单元根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式，包括用于：

20.如权利要求18所述的计算设备，其特征在于，所述M个对象中每个对象的未来数据序列包括H个数据，H为正整数；所述预测单元根据所述第第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式，包括用于：

21.如权利要求19或20所述的计算设备，其特征在于，所述预测单元用于将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，所述第五矩阵D为对角矩阵；

所述预测单元根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列，用于包括：

22.如权利要求21所述的计算设备，其特征在于，所述L为所述第五矩阵D中大于预设阈值的元素的个数。

23.一种计算设备，其特征在于，包括处理器和存储器，所述处理器连接到所述存储器，所述处理器用于调用所述存储器存储的程序代码执行：

24.如权利要求23所述的计算设备，其特征在于，所述处理器执行所述根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离，得到相似距离集合包括执行：

25.如权利要求24所述的计算设备，其特征在于，对象i和对象j为所述N个对象中的任意两个对象，所述对象i与所述对象j之间的相似距离通过下面公式计算：

26.如权利要求25所述的计算设备，其特征在于，所述d_cor(y_i,y_j)的计算公式为：

27.如权利要求25所述的计算设备，其特征在于，所述N个对象的层次结构为树形结构；其中，所述d_dis(y_i,y_j)为所述对象i在所述树形结构中节点位置所属层级与所述对象j在所述树形结构中节点位置所属的层级之差。

28.如权利要求23-27任意一项权利要求所述的计算设备，其特征在于，所述第一预测对象类为所述至少一个预测对象类中任意一个预测对象类；

所述处理器执行所述对所述第一预测对象类中所包含对象的未来数据序列进行预测，包括执行：

29.如权利要求28所述的计算设备，其特征在于，所述第一预测对象类包括M个对象，M≤N，M为正整数，所述M个对象中每个对象的历史数据序列包括T个数据，T为大于1的正整数；

所述处理器执行所述根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式，包括执行：

30.如权利要求29所述的计算设备，其特征在于，所述M个对象中每个对象的未来数据序列包括H个数据，H为正整数；所述处理器执行所述根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式包括执行：

31.如权利要求29所述的计算设备，其特征在于，所述M个对象中每个对象的未来数据序列包括H个数据，H为正整数；所述处理器执行所述根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式包括执行：

32.如权利要求30或31所述的计算设备，其特征在于，所述处理器执行所述将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解，还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D，其中，第四矩阵U为正交矩阵，所述第五矩阵D为对角矩阵；

所述处理器执行所述根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列，具体执行：

33.如权利要求32所述的计算设备，其特征在于，所述L为所述第五矩阵D中大于预设阈值的元素的个数。

34.一种计算机存储介质，其特征在于，所述计算机存储介质用于计算机软件指令，所述计算机软件指令当被计算机执行时使所述计算机执行如权利要求1-11中任一权利要求所述的数据序列预测方法。