WO2019214455A1 - 一种数据序列预测方法及计算设备 - Google Patents

一种数据序列预测方法及计算设备 Download PDF

Info

Publication number
WO2019214455A1
WO2019214455A1 PCT/CN2019/084399 CN2019084399W WO2019214455A1 WO 2019214455 A1 WO2019214455 A1 WO 2019214455A1 CN 2019084399 W CN2019084399 W CN 2019084399W WO 2019214455 A1 WO2019214455 A1 WO 2019214455A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
matrix
historical
prediction
objects
Prior art date
Application number
PCT/CN2019/084399
Other languages
English (en)
French (fr)
Inventor
陈新杰
曾嘉
陈菂
朱方舟
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2019214455A1 publication Critical patent/WO2019214455A1/zh
Priority to US17/038,635 priority Critical patent/US20210012152A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Fuzzy Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种人工智能领域中的数据序列预测方法及计算设备,该方法包括:根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,所述相似距离用于表征两个对象的相似程度,所述历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;根据所述相似距离集合,通过聚类算法将所述N个对象划分为K个预测对象类,K为正整数,K≤N;对所述K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。实施本发明实施例,通过聚类算法,自动定义预测对象类,效率高且更加准确。

Description

一种数据序列预测方法及计算设备 技术领域
本发明涉及大数据技术领域,尤其涉及一种数据序列预测方法及计算设备。
背景技术
对象的数据序列的预测,例如,产品需求预测,指为保证及时满足客户的需求,预测各个产品(包括整机、半成品、采购件等)的需求,以指导整机或半成品的提前加工、采购件的提前采购。对于某些制造公司来说,整机由半成品和采购件组装而成,整机、半成品、采购件之间存在固定和非固定的产品层次结构。其中,固定的产品层次结构是由固定的产品配置清单决定,例如,一个机箱(半成品)需要的电源背板是由固定的电源连接器、电阻和电容组成。非固定的产品层次结构是由客户订单决定的,例如一个服务器(整机)的订单会选择配置2G的内存或4G的内存。
产品的需求预测需要考虑两个方面的内容,一个是预测准确率,即需求预测值和需求真实值之间层差异;另一个是预测一致性,即客户需求通过订单向公司采购整机,整机需要一系列的半成品和采购件组成,需要保证半成品的预测值、采购件的预测值、整机的预测值之间的一致性,避免一种产品(例如第一采购件)预测过多,导致多余的第一采购件无法消耗;或者一个产品预测过少,影响半成品或整机的生产,最终影响订单的交付。
如图1所示的现有技术中数据预测方法的示意性说明图。为保证产品之间预测一致性,首先需要人工定义预测对象类,将整机、半成品、采购件基于历史需求与产品层次结构进行归类,其次,对于同一预测对象类内的预测层级的产品的需求进行预测,输出该预测对象类内预测层级的产品的预测需求值,进而,基于产品之间的层次结构进行拆解或集成加总,对该预测对象类内调整层级的产品进行一致性调整。
然而,上述数据预测方法还需要人工定义对应的预测对象类,大大降低了应用的便利性,当产品的数量巨大时,通过人工对产品进行分类效率低。
发明内容
本发明实施例提供了一种数据序列预测方法,能够通过聚类算法自动定义预测对象类,效率高且更加准确。
第一方面,本申请实施例提供了一种数据序列预测方法,包括:计算设备或数据序列预测系统根据N个对象的历史数据序列计算该N个对象中每两个对象之间的相似距离得到相似距离集合;根据该相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;进而,对该K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。其中,相似距离用于表征两个对象的相似程度,历史数据序列包括按照预设规律排列的多个数据,N为大于1正整数;K为正整数,K≤N。
相对于现有技术中,人工定义对象类,本申请实施例中,通过聚类算法自动定义预测对象类,效率高且更加准确。
需要说明的是,本申请各个实施例中数据序列预测方法的执行主体可以是计算设备或数据序列预测系统,以下以计算设备为例来说明。
在一种可能的实现方式中,计算设备根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离,得到相似距离集合的一种实施方式可以是:计算设备根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的数据相似距离;计算所述N个对象中每两个对象之间的层次相似距离;进而,根据所述N个对象中每两个对象之间的数据相似距离和层次相似距离,得到所述相似距离集合,所述相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
其中,所述数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度,所述层次相似距离用于表征两个对象在层次结构中所在层级的相似程度。
本申请实施例中,通过对象之间的数据相似距离和层次相似距离表征对象间相似距离,基于该相似距离进行分类更加准确。
在又一种可能的实现方式中,相似距离集合包括对象i和对象j的相似距离,
对象i和对象j为所述N个对象中的任意两个对象,所述对象i与所述对象j之间的相似距离可以通过下面公式计算:
Figure PCTCN2019084399-appb-000001
其中,y i为所述对象i的历史数据序列,y j为所述对象j的历史数据序列;所述d cor(y i,y j)为所述对象i与所述对象j之间的数据相似距离,所述d dis(y i,y j)为所述对象i与所述对象j的层次相似距离。
在又一种可能的实现方式中,d cor(y i,y j)的计算公式可以为:
Figure PCTCN2019084399-appb-000002
其中,
Figure PCTCN2019084399-appb-000003
所述Cor(y i,y j)为所述对象i和所述对象j的皮尔逊相关性值;y it为所述对象i的历史数据序列中第t个数据;y jt为所述对象j的历史数据序列中第t个数据,t为正整数,t≤Q;Q为所述对象i中历史数据序列包含数据的个数,为正整数。
在又一种可能的实现方式中,该N个对象的层次结构为树形结构;其中,d dis(y i,y j)为对象i在所述树形结构中节点位置所属层级与所述对象j在所述树形结构中节点位置所属的层级之差。
在又一种可能的实现方式中,所述第一预测对象类为所述至少一个预测对象类中任意一个预测对象类;计算设备对所述第一预测对象类中所包含对象的未来数据序列进行预测的一种实施方式可以是:计算设备根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式,根据所述第一预测对象类的历史共同数据模 式预测所述第一预测对象类的未来数据模式,进而,根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列。其中,该第一预测对象类的历史共同数据模式用于表示所述第一预测对象类中所有对象的历史数据序列的所包含的共同特征。
本申请实施例中,在对同一预测对象类中对象的未来数据序列进行预测时,通过抽取历史数据模式、预测未来数据模式、进而根据未来数据模式还原出未来数据序列,提升了数据序列预测一致性和预测准确性。
在又一种可能的实现方式中,所述第一预测对象类包括M个对象,M≤N,M为正整数,所述M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
所述计算设备根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式的一种实施方式可以是:计算设备将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,所述第一矩阵的逆矩阵为正交矩阵,所述第一矩阵的每一行数据组成一个历史数据模式;进而,从所述第一矩阵抽取出第1至第L个历史数据模式作为所述第一预测对象类的历史共同数据模式,L为正整数,L≤T。
本申请实施例中,提供了一种历史共同数据模式的求解方法,以实现从N个对象的历史数据序列中抽取出可以表达第一预测对象类中所有对象的历史数据序列的共同特征的历史共同数据模式。
在又一种可能的实现方式中,所述M个对象中每个对象的未来数据序列包括H个数据,H为正整数;所述计算设备根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式的第一种实施方式可以是:
计算设备根据所述第一预测对象类的历史共同数据模式训练出H个数据模式模型,该H个数据模式模型中的第k数据模式模型用于预测所述第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000004
中第k列数据,k为正整数,k≤H,该第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到所述H个数据模式模型中的第k数据模式模型,预测出所述第二矩阵
Figure PCTCN2019084399-appb-000005
中第k列数据,p为正整数,1<p<T,所述第三矩阵V 1的每一行组成一个历史共同数据模式;
将所述H个数据模式模型所预测出的数据组合得到所述第二矩阵
Figure PCTCN2019084399-appb-000006
所述第二矩阵
Figure PCTCN2019084399-appb-000007
的每一行数据组成一个未来数据模式。
本申请实施例中,提供了一种基于历史共同数据模式的未来数据模式的预测方式。
在又一种可能的实现方式中,所述M个对象中每个对象的未来数据序列包括H个数据,H为正整数;所述计算设备根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式的第二种实施方式可以是:
计算设备根据所述第一预测对象类的历史共同数据模式训练出数据模式模型;
将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到所述数据模式模型,预测出所述第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000008
中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;所述第三矩阵 V 1的每一行组成一个历史共同数据模式;所述第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将k依次取1至H时所预测出的数据进行组合得到所述第二矩阵
Figure PCTCN2019084399-appb-000009
所述第二矩阵
Figure PCTCN2019084399-appb-000010
的每一行数据组成一个未来数据模式。
本申请实施例中,提供了一种基于历史共同数据模式的未来数据模式的预测方式。仅仅需要训练一个数据模式模型,大大减少模型的的训练,提升计算效率。
在又一种可能的实现方式中,计算设备将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,所述第五矩阵D为对角矩阵;计算设备根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列的一种实施方式可以是:
Figure PCTCN2019084399-appb-000011
其中,
Figure PCTCN2019084399-appb-000012
为所述第一预测对象类所包含对象的未来数据序列组成的矩阵;所述U 1为所述第四矩阵U的第1至L列数据组成的矩阵,所述D 1为所述第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。
本申请实施例中,提供了一种基于未来数据模式预测对象的未来数据序列的方式,简便。快捷。
在又一种可能的实现方式中,作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小,L可以选定为所述第五矩阵D中大于预设阈值的元素的个数,通过减少历史数据模式的个数减少运算量。
第二方面,本申请实施例提供了一种计算设备,包括:
距离计算单元,用于根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,相似距离用于表征两个对象的相似程度,历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;
对象分类单元,用于根据相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;K为正整数,K≤N;
预测单元,用于对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
在一种可能的实现方式中,距离计算单元具体用于:
根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离;数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度;
计算N个对象中每两个对象之间的层次相似距离,层次相似距离用于表征两个对象在层次结构中所在层级的相似程度;
根据N个对象中每两个对象之间的数据相似距离和层次相似距离,得到相似距离集合,相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
在又一种可能的实现方式中,对象i和对象j为N个对象中的任意两个对象,对象i与对象j之间的相似距离通过下面公式计算:
Figure PCTCN2019084399-appb-000013
其中,y i为对象i的历史数据序列,y j为对象j的历史数据序列;d cor(y i,y j)为对象i与对象j之间的数据相似距离,d dis(y i,y j)为对象i与对象j的层次相似距离。
在又一种可能的实现方式中,d cor(y i,y j)的计算公式为:
Figure PCTCN2019084399-appb-000014
其中,
Figure PCTCN2019084399-appb-000015
Cor(y i,y j)为对象i和对象j的皮尔逊相关性值;y it为对象i的历史数据序列中第t个数据;y jt为对象j的历史数据序列中第t个数据,t为正整数,t≤Q;Q为对象i中历史数据序列包含数据的个数,为正整数。
可选地,N个对象的层次结构为树形结构;其中,d dis(y i,y j)为对象i在树形结构中节点位置所属层级与对象j在树形结构中节点位置所属的层级之差。
在又一种可能的实现方式中,第一预测对象类为至少一个预测对象类中任意一个预测对象类;
预测单元用于对第一预测对象类所包含对象的未来数据序列进行预测,包括用于:
根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,第一预测对象类的历史共同数据模式用于表示第一预测对象类中所有对象的历史数据序列的所包含的共同特征;
根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式;
根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列。
在又一种可能的实现方式中,第一预测对象类包括M个对象,M≤N,M为正整数,M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
预测单元根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,包括用于:
将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,第一矩阵的逆矩阵为正交矩阵,第一矩阵的每一行数据组成一个历史数据模式;
从第一矩阵抽取出第1至第L个历史数据模式作为第一预测对象类的历史共同数据模式,L为正整数,L≤T。
在又一种可能的实现方式中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;
预测单元根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式,包括用于:
根据第一预测对象类的历史共同数据模式训练出H个数据模式模型,H个数据模式模型中的第k数据模式模型用于预测第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000016
中第k列数据,k为正整数,k≤H,第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到H个数据模式模型中的第k数据模式模型,预测出第二矩阵
Figure PCTCN2019084399-appb-000017
中第k列数据,p为正整数,1<p<T,第三矩阵V 1的每一行组成一个历史共同数据模式;
将H个数据模式模型所预测出的数据组合得到第二矩阵
Figure PCTCN2019084399-appb-000018
第二矩阵
Figure PCTCN2019084399-appb-000019
的每一行数据组成一个未来数据模式。
在又一种可能的实现方式中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;预测单元根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式,包括用于:
根据第一预测对象类的历史共同数据模式训练出数据模式模型;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到数据模式模型,预测出第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000020
中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;第三矩阵V 1的每一行组成一个历史共同数据模式;第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将k依次取1至H时所预测出的数据进行组合得到第二矩阵
Figure PCTCN2019084399-appb-000021
第二矩阵
Figure PCTCN2019084399-appb-000022
的每一行数据组成一个未来数据模式。
在又一种可能的实现方式中,预测单元用于将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,第五矩阵D为对角矩阵;
预测单元根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列,用于包括:
Figure PCTCN2019084399-appb-000023
其中,
Figure PCTCN2019084399-appb-000024
为第一预测对象类所包含对象的未来数据序列组成的矩阵;U 1为第四矩阵U的第1至L列数据组成的矩阵,D 1为第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。
在又一种可能的实现方式中,作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小,L可以选定为第五矩阵D中大于预设阈值的元素的个数,通过减少历史数据模式的个数减少运算量。
第三方面,本申请实施例还提供了一种计算设备,包括处理器和存储器,处理器连接到存储器,处理器用于调用存储器存储的程序代码执行:
根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,相似距离用于表征两个对象的相似程度,历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;
根据相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;K为正整数, K≤N;
对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
在一种可能的实现方式中,处理器执行根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合包括执行:
根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离,数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度;
计算N个对象中每两个对象之间的层次相似距离,层次相似距离用于表征两个对象在层次结构中所在层级的相似程度;
根据N个对象中每两个对象之间的数据相似距离和层次相似距离,得到相似距离集合,相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
在又一种可能的实现方式中,
对象i和对象j为N个对象中的任意两个对象,对象i与对象j之间的相似距离通过下面公式计算:
Figure PCTCN2019084399-appb-000025
其中,y i为对象i的历史数据序列,y j为对象j的历史数据序列;d cor(y i,y j)为对象i与对象j之间的数据相似距离,d dis(y i,y j)为对象i与对象j的层次相似距离。
在又一种可能的实现方式中,d cor(y i,y j)的计算公式为:
Figure PCTCN2019084399-appb-000026
其中,
Figure PCTCN2019084399-appb-000027
Cor(y i,y j)为对象i和对象j的皮尔逊相关性值;y it为对象i的历史数据序列中第t个数据;y jt为对象j的历史数据序列中第t个数据,t为正整数,t≤Q;Q为对象i中历史数据序列包含数据的个数,为正整数。
在又一种可能的实现方式中,N个对象的层次结构为树形结构;其中,d dis(y i,y j)为对象i在树形结构中节点位置所属层级与对象j在树形结构中节点位置所属的层级之差。
在又一种可能的实现方式中,第一预测对象类为至少一个预测对象类中任意一个预测对象类;处理器执行对第一预测对象类中所包含对象的未来数据序列进行预测,包括执行:
根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,第一预测对象类的历史共同数据模式用于表示第一预测对象类中所有对象的历史数据序列的所包含的共同特征;
根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式;
根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列。
在又一种可能的实现方式中,第一预测对象类包括M个对象,M≤N,M为正整数, M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
处理器执行根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,包括执行:
将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,第一矩阵的逆矩阵为正交矩阵,第一矩阵的每一行数据组成一个历史数据模式;
从第一矩阵抽取出第1至第L个历史数据模式作为第一预测对象类的历史共同数据模式,L为正整数,L≤T。
在又一种可能的实现方式中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;处理器执行根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式包括执行:
根据第一预测对象类的历史共同数据模式训练出H个数据模式模型,H个数据模式模型中的第k数据模式模型用于预测第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000028
中第k列数据,k为正整数,k≤H,第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到H个数据模式模型中的第k数据模式模型,预测出第二矩阵
Figure PCTCN2019084399-appb-000029
中第k列数据,p为正整数,1<p<T,第三矩阵V 1的每一行组成一个历史共同数据模式;
将H个数据模式模型所预测出的数据组合得到第二矩阵 第二矩阵
Figure PCTCN2019084399-appb-000031
的每一行数据组成一个未来数据模式。
在又一种可能的实现方式中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;处理器执行根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式包括执行:
根据第一预测对象类的历史共同数据模式训练出数据模式模型;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到数据模式模型,预测出第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000032
中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;第三矩阵V 1的每一行组成一个历史共同数据模式;第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将k依次取1至H时所预测出的数据进行组合得到第二矩阵
Figure PCTCN2019084399-appb-000033
第二矩阵
Figure PCTCN2019084399-appb-000034
的每一行数据组成一个未来数据模式。
在又一种可能的实现方式中,处理器执行将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,第五矩阵D为对角矩阵;
根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列,具体包括:
Figure PCTCN2019084399-appb-000035
其中,
Figure PCTCN2019084399-appb-000036
为第一预测对象类所包含对象的未来数据序列组成的矩阵;U 1为第四矩阵U的第1至L列数据组成的矩阵,D 1为第五矩阵D的第1至L行数据中的第1至L列的数 据组成的矩阵。
在又一种可能的实现方式中,作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小,L可以选定为第五矩阵D中大于预设阈值的元素的个数,通过减少历史数据模式的个数减少运算量。
第四方面,本发明实施例还提供了一种数据序列预测系统,该数据序列预测系统包括但不限于:
距离计算模块,用于根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,相似距离用于表征两个对象的相似程度,历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;
对象分类模块,用于根据相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;K为正整数,K≤N;
预测模块,用于对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
可选地,该数据序列预测系统还可以包括数据输入模块和/或结果输出模块。其中,数据输入模块用于:接收数据,并将数据转换为预测模块需要的数据格式,该数据可以包括N个对象的历史数据序列。结果输出模块用于:输出预测模块的预测结果。
在一种可能的实现方式中,距离计算模块具体用于:
根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离;数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度;
计算N个对象中每两个对象之间的层次相似距离,层次相似距离用于表征两个对象在层次结构中所在层级的相似程度;
根据N个对象中每两个对象之间的数据相似距离和层次相似距离,得到相似距离集合,相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
在又一种可能的实现方式中,对象i和对象j为N个对象中的任意两个对象,对象i与对象j之间的相似距离通过下面公式计算:
Figure PCTCN2019084399-appb-000037
其中,y i为对象i的历史数据序列,y j为对象j的历史数据序列;d cor(y i,y j)为对象i与对象j之间的数据相似距离,d dis(y i,y j)为对象i与对象j的层次相似距离。
在又一种可能的实现方式中,d cor(y i,y j)的计算公式为:
Figure PCTCN2019084399-appb-000038
其中,
Figure PCTCN2019084399-appb-000039
Cor(y i,y j)为对象i和对象j的皮尔逊相关性值;y it为对象i的历史数据序列中第t个数据;y jt为对象j的历史数据序列中第 t个数据,t为正整数,t≤Q;Q为对象i中历史数据序列包含数据的个数,为正整数。
可选地,N个对象的层次结构为树形结构;其中,d dis(y i,y j)为对象i在树形结构中节点位置所属层级与对象j在树形结构中节点位置所属的层级之差。
在又一种可能的实现方式中,第一预测对象类为至少一个预测对象类中任意一个预测对象类;
预测模块用于对第一预测对象类所包含对象的未来数据序列进行预测,包括用于:
根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,第一预测对象类的历史共同数据模式用于表示第一预测对象类中所有对象的历史数据序列的所包含的共同特征;
根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式;
根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列。
在又一种可能的实现方式中,第一预测对象类包括M个对象,M≤N,M为正整数,M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
预测模块根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,包括用于:
将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,第一矩阵的逆矩阵为正交矩阵,第一矩阵的每一行数据组成一个历史数据模式;
从第一矩阵抽取出第1至第L个历史数据模式作为第一预测对象类的历史共同数据模式,L为正整数,L≤T。
在又一种可能的实现方式中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;
预测模块根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式,包括用于:
根据第一预测对象类的历史共同数据模式训练出H个数据模式模型,H个数据模式模型中的第k数据模式模型用于预测第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000040
中第k列数据,k为正整数,k≤H,第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到H个数据模式模型中的第k数据模式模型,预测出第二矩阵
Figure PCTCN2019084399-appb-000041
中第k列数据,p为正整数,1<p<T,第三矩阵V 1的每一行组成一个历史共同数据模式;
将H个数据模式模型所预测出的数据组合得到第二矩阵
Figure PCTCN2019084399-appb-000042
第二矩阵
Figure PCTCN2019084399-appb-000043
的每一行数据组成一个未来数据模式。
在又一种可能的实现方式中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;预测模块根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式,包括用于:
根据第一预测对象类的历史共同数据模式训练出数据模式模型;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到数据模式模型,预测出第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000044
中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;第三矩阵V 1的每一行组成一个历史共同数据模式;第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将k依次取1至H时所预测出的数据进行组合得到第二矩阵
Figure PCTCN2019084399-appb-000045
第二矩阵
Figure PCTCN2019084399-appb-000046
的每一行数据组成一个未来数据模式。
在又一种可能的实现方式中,预测模块用于将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,第五矩阵D为对角矩阵;
预测模块根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列,用于包括:
Figure PCTCN2019084399-appb-000047
其中,
Figure PCTCN2019084399-appb-000048
为第一预测对象类所包含对象的未来数据序列组成的矩阵;U 1为第四矩阵U的第1至L列数据组成的矩阵,D 1为第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。
在又一种可能的实现方式中,作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小,L可以选定为第五矩阵D中大于预设阈值的元素的个数,通过减少历史数据模式的个数减少运算量。
第五方面,本发明实施例还提供了一种计算机存储介质,其特征在于,所述计算机存储介质用于计算机软件指令,所述计算机软件指令当被计算机执行时使所述计算机执行如第一方面所述的任意一种数据序列预测方法。
第六方面,本发明实施例还提供了一种计算机程序,所述计算机程序包括计算机软件指令,所述指令当被计算机执行时使计算机执行第一方面所述的任一种数据序列预测方法。
综上,本申请实施例根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合,该相似距离用于表征两个对象的相似程度;进而,根据得到相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;再对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。实施本发明实施例,通过聚类算法,自动定义预测对象类,效率高且更加准确。
而且,在对同一预测对象类中对象的未来数据序列进行预测时,通过抽取历史数据模式、预测未来数据模式、进而根据未来数据模式还原出未来数据序列,提升了数据序列预测一致性和预测准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为现有技术中数据预测方法的示意性说明图;
图2为本申请实施例提供的一种产品层次结构的示意性说明图;
图3为本申请实施例提供的一种数据序列预测方法的应用场景示意图;
图4为本申请实施例提供的一种数据序列预测系统的架构示意图;
图5为本申请实施例提供的一种数据序列预测方法的流程示意图;
图6为本申请实施例提供的一种预测对象类的示意性说明图;
图7为本申请实施例提供的一种对第一预测对象类中对象的未来数据序列进行预测的方法的流程示意图;
图8为本申请实施例提供的第一种根据历史共同数据模式预测未来数据模式的原理示意图;
图9为本申请实施例提供的第二种根据历史共同数据模式预测未来数据模式的原理示意图;
图10为本申请实施例提供的一种计算设备的结构示意图;
图11为本申请实施例提供的另一种计算设备的结构示意图。
具体实施方式
下面将结合附图对现有技术或者本发明实施例中的技术方案进行清楚、完整地描述。
下面介绍本发明实施例涉及的概念、术语。
本申请实施例中包括多个对象(object),对象作为本申请实施例中研究对象,可以是被销售或采购的物体(如产品),也可以是其他对象,本申请实施例不作限定。可选地,该多个对象之间可以存在层次结构,该层次结构可以是树形结构。
本申请实施例中,树形结构指对象之间存在着“一对多”的对应关系。树形结构可以表示对象之间的层次关系。
数据序列,指按照预设规律排列的多个数据。可选地,该数据序列可以是按照时间顺序排列的多个数据。
历史数据序列,指已获得的数据序列。
未来数据序列,指待预测的数据序列。
应理解,对于按照时间顺序排列的数据序列来说,历史数据序列可以是第一时间点之前的数据序列,未来数据序列可以是第一时间点之后的数据序列。
相似距离,表征两个对象之间历史数据的相似程度,相似距离越小,越可能被划分到同一对象类。
聚类算法,可以是基于距离的聚类算法,把多个对象集分割成不同的类或簇,使得同一个类内的对象的相似性尽可能大,同时不在同一个类中的对象的差异性也尽可能地大。
对象类:是指有一定关系的多个产品的集合。本申请实施例中,对象类为根据多个对象的历史数据序列通过聚类算法将该多个对象划分的类。
一致性预测:指对于同一个对象类,预测时考虑各个对象类中的对象间的层次关系,保证各个对象类的预测数据的一致性。
固定层次结构,指一个对象对应一个或多个固定的对象。例如,一个半成品又固定的 生产配置清单,例如,一个机箱需要的电源背板是由固定的电源连接器、电阻、电容组成,则机箱与电源连接器、电阻、电容存在固定层次结构。
非固定层次结构,指一个对象对应一个或多个非固定的对象。例如,一个服务器的订单会选择配置4G的内容或2G的内存,则服务器与2G的内存、4G的内存存在非固定层次结构。
对角矩阵:只有对角线上的值非0,其他值为0的矩阵。
自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,简称ARIMA),是由博克思(Box)和詹金斯(Jenkins)提出一种时间序列预测方法,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。
下面介绍本申请数据序列预测方法可应用的一种场景:
本发明数据序列预测方法可以应用在多个时间序列,且序列之间存在一定关系的预测问题中,例如供应链的多产品的需求预测问题,多地区(市及下属区)的电力预测问题等。下面以具有树形结构的多个产品的需求预测为例来说明本申请数据序列预测方法的应用场景。
请参阅图2,图2是本申请实施例提供的一种产品层次结构的示意性说明图。
整机(Pick to Order,PTO):是指用于直接销售的完整产品,例如一台服务器、计算机等,该整机可以是图2中产品1。
半成品(Assembled Item,AI):是指需要通过工厂进行加工的中间件,该半成品可以是图2中,产品2、产品3、产品4、产品5、产品6。
采购件(Purchased Item,PI):是指直接通过采购获取的产品,可以是图2中产品7、产品8、产品9、产品10、产品11、产品12。
如图3的应用场景图,体现了本申请数据序列预测方法在企业履行客户需求中的功能。由于采购件以及半成品存在采购周期和生产周期的限制,需要通过需求预测进行提前储备,以匹配客户的需求周期,按期履行客户的需求,基本步骤如下:
步骤S301:客户将需求信息(例如订单信息)传递市场计划或者订单管理部门
步骤S302:市场计划或者订单管理部门将历史以及未来相关订单信息输入到需求预测系统中。
步骤S303:需求预测系统对采购间,半成品等产品的未来需求进行预测,将对采购件的需求预测值传递给供应商进行采购,将对半成品需求预测值传递给工厂进行提前加工制造。
步骤S304:工厂进行加工制造,履行订单将产品交付给客户。
需求预测系统对未来需求进行预测的方法可以参见下述数据序列预测方法实施例中相关描述,本申请实施例不再赘述。
请参阅图4,图4是本申请实施例提供的一种数据序列预测系统的架构示意图,该数据序列预测系统可以应用于一个或多个计算设备,该数据序列预测系统可以包括:
数据输入模块41,用于接收数据,并将数据转换为预测模块需要的数据格式,该数据可以包括N个对象的历史数据序列。
距离计算模块42,用于根据N个对象的历史数据序列计算该N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,相似距离用于表征两个对象的相似程度,历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数。
对象分类模块43,用于根据所述相似距离集合,通过聚类算法将所述N个对象划分为K个预测对象类;K为正整数,K≤N。
预测模块44,用于根据N个对象的历史数据序列对K个对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
结果输出模块45,用于输出预测模块的预测结果。
需要说明的是,虽然图4给出了数据输入模块41、结果输出模块45,但数据输入模块41和/或结果输出模块45不是数据预测系统必须的组成部分。
还需要说明的是,数据序列预测系统可以应用于各种场景,例如上述需求预测系统即为数据序列预测系统在产品需求预测场景中的一种表达形式。上述各个模块可以分别设置于计算设备中,也可以设置于同于计算设备中,本申请实施例不作限定。各个模块或单元功能的具体实现,可以参见下述数据序列预测方法实施例中相关描述,本申请实施例不再赘述。
下面介绍本发明涉及的一种数据序列预测方法,该方法可以应用于上述数据预测系统,也可以应用于一个或多个计算设备中。本申请实施例以数据序列预测方法应用于一个计算设备为例来说明。
应理解,本申请实施例中,各个对象对应一个历史数据序列,该历史数据序列包括按照预设规律排列的多个数据。
可选地,该预设规律可以是时间先后,数据序列为对象随时间推移而形成的数据序列。历史数据序列为对象第一时间点之前按照时间先后依次生成的多个数据。未来数据序列为预测的对象在第一时间点之后按照时间先后排列的一个或多个数据。
例如,对象为产品,对象的历史数据序列为产品在过去的一个年内每月的需求数量。该数据序列预测方法应用于产品需求预测,可以预测出各个产品在未来一段时间内每月的需求数量。可以理解,产品之间可以存在结构层次。例如,请参阅图2所示的产品的层次结构的示意性说明图。
又例如,对象为地区,该地区可以中国各个省、市、县、区等,历史数据序列为地区在过去的一个月内每天的电力需求瓦数。该数据序列预测方法应用于电力需求预测,可以预测出各个地区在未来一段时间内每天的需求瓦数。可以理解,地区之间存在固定的层次结构。一个省可以包括多个市,一个市可以包括多个区、县等。
需要说明的是,对象的历史数据序列还可以是其他规律,本发明实施例不作限定。
请参阅图5,图5是本申请实施例提供的一种数据序列预测方法的流程示意图,该数据序列预测方法包括但不限于以下部分或全部步骤:
步骤S1:根据N个对象的历史数据序列计算该N个对象中每两个对象之间的相似距 离,得到相似距离集合。
其中,相似距离用于表征两个对象的相似程度。历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数。
可以理解,相似距离集合可以包括N(N-1)/2个相似距离值。
对象i和对象j分别为N个对象中任意两个不同的对象,i,j为正整数,且i≤N,j≤N,i≠j。相似距离集合包括对象i和对象j的相似距离。
对象i的历史数据序列可以表示为y i=[y i1 y i2 ... y iT]。
对象j的历史数据序列可以表示为y j=[y j1 y j2 ... y jT]。
其中,T为大于1的正整数。
本发明实施例中,对象i和对象j的相似距离可以具有以下两种表达方式。
第一表达方式:
N个对象之间可以存在层次结构。可以通过数据相似距离d cor(y i,y j)和层次相似距离d dis(y i,y j)来表示对象i和对象j的相似距离d(y i,y j)。具体地,计算设备根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离,以及计算该N个对象中每两个对象之间的层次相似距离;进而,根据N个对象中每两个对象之间的数据相似距离和层次相似距离,得到相似距离集合,该相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。其中,数据相似距离用于表征两个对象分别对应的历史数据序列之间的相似程度。层次相似距离用于表征两个对象层次结构中所在的层级的相似程度。
可选地,计算设备计算对象i和对象j之间的相似距离的一种实施方式可以是:
对象i与对象j的数据相似距离可以表示为:
Figure PCTCN2019084399-appb-000049
其中,公式(1)中,Cor(y i,y j)为所述第一对象和所述第二对象的皮尔逊相关性值,Cor(y i,y j)可以表示为:
Figure PCTCN2019084399-appb-000050
其中,y it为所述对象i的历史数据序列中第t个数据;y jt为所述对象j的历史数据序列中第t个数据,t为正整数,t≤T。
可选地,N个对象的层次结构为树形结构,对象i与对象j的层次相似距离d dis(y i,y j)可以是对象i在该树形结构中节点位置所属层级与对象j在该树形结构中节点位置所属的层级之差。
如图4所示,产品1和产品2之间的层次相似距离为1,产品1和产品3之间的层次相似距离为2。
进而,对象i与对象j的层次相似距离可以表示为:
d(y i,y j)=f(d dis(y i,y j))*d cor(y i,y j)        (3)
其中,
Figure PCTCN2019084399-appb-000051
i、j为正整数,且i≤N,j≤N,i≠j。
第二表达方式:
N个对象之间可以不存在层次结构或者N个对象之间存在层次结构,但在计算相似距离时可以不考虑。可以通过数据相似距离d cor(y i,y j)单独来表示对象i和对象j的相似距离。
d(y i,y j)=d cor(y i,y j)        (4)
对象i与对象j的数据相似距离d cor(y i,y j)的计算可以参见上述第一表达方式中相关描述,本发明实施例不再赘述。
应理解,通过上述对象i和对象j的相似距离的求解方法可以得到相似距离集合。
步骤S2:根据该相似距离集合,通过聚类算法将该N个对象划分为K个预测对象类。其中,K为正整数,K<N。
例如,图3所示的产品的层次结构在聚类后划分成图6所示的3个预测对象类,使得具有相近的相似距离的对象划分到同一预测对象类中,分别为第一预测对象类、第二预测对象类和第三预测对象类。
本发明实施例中聚类算法以对象之间的相似距离的远近确定对象所属的类。聚类算法可以包括但不限于K均值聚类算法(K-means)、K中心聚类算法(K-median)、K中心点聚类算法K-center、谱聚类算法(Spectral clustering)、基于密度的聚类算法(Density-based clustering)等。
通过上述聚类算法可以将N个对象划分为K个预测对象类,聚类算法为现有技术,本发明实施例不再赘述。
预测对象类A为K个预测对象类中任意一个预测对象类,对象f为预测对象类A中任意一个对象。一般地,对象f与预测对象类A中对象之间的相似距离小于对象f与预测对象类A之外任意一个对象的相似距离。
步骤S3:对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
其中,第一预测对象类为至少一个预测对象类中任意一个预测对象类,该第一预测对象类包括M个对象,M≤N,M为正整数。
本申请一实施例中,如图7所示对第一预测对象类中对象的未来数据序列进行预测的方法的流程示意图,该方法可以包括以下步骤:
步骤S31:根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式;
步骤S32:根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式;
步骤S33:根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列。
可选地,步骤S31的一种实施方式可以是:
M个对象的历史数据序列可以组成一个M×T阶的矩阵Y。通过奇异值分解该M×T 阶的矩阵Y可以得到T×T阶的第一矩阵V、M×M阶的第四矩阵U、M×T阶的第五矩阵D和。即:
Y=UDV       (5)
其中,矩阵Y中每一行元素表示一个对象的历史数据序列。Y可以表示为:
Figure PCTCN2019084399-appb-000052
第一矩阵的逆矩阵V -1为正交矩阵,第一矩阵V中每一行元素表示一个历史数据模式。任意一个历史数据模式为T个数据组成的数据序列,V可以表示为:
Figure PCTCN2019084399-appb-000053
其中,第五矩阵D为对角矩阵,若L<T<M,则D可以表示为:
Figure PCTCN2019084399-appb-000054
第五矩阵D中对角线上的值d ii,表示第i个历史数据模式的权重。奇异值分解得到的对角矩阵D对角线上的值以d 11最大,随i增大,对角线上的值d ii减小。当
其中,模式数据矩阵U为正交矩阵,U可以表示为:
Figure PCTCN2019084399-appb-000055
第四矩阵U中第i行元素表示M个对象中第i对象在各个历史数据模式上的值。
本发明实施例以T≤M为例来说明,根据公式(5),可知:
Figure PCTCN2019084399-appb-000056
即M个对象中第i对象的历史数据序列中第j个数据为抽取出的各个历史数据模式中第j个数据的加权。一个历史数据模式的整体重要性以D决定,不同对象的重要性更进一步以模式数据矩阵U决定。
并非所有历史数据模式都是预测对象类中对象所共有的,只有部分重要的历史数据模式代表了预测对象类中的历史共同数据模式。由于第五矩阵D中对角线上的值d ii随i增大而不断减小,因此可以选取第一矩阵中第1至L行历史数据模式作为历史共同数据模式。此时,第一矩阵可以表示为:
Figure PCTCN2019084399-appb-000057
可以理解,历史共同数据模式反应了第一预测对象类中所有对象中隐含的共同特征,第一预测对象类中任意一个对象的历史数据序列中各个元素可以表示为历史共同数据模式的线性叠加。
可选地,作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小,L可以选定为第五矩阵D中大于预设阈值的元素的个数,进而通过减少历史数据模式的个数减少运算量。
可选地,选取的L历史数据模式可以组成第三矩阵。同时,抽取模式数据矩阵U中的前L列元素组成矩阵U 1,抽取第五矩阵D中的第1至L行数据中的第1至L列元素组成矩阵D 1,如图2所示,其中U 1、D 1、V 1可以分别表示为:
Figure PCTCN2019084399-appb-000058
Figure PCTCN2019084399-appb-000059
第三矩阵
Figure PCTCN2019084399-appb-000060
需要说明的是,若T≤M,则L≤T;若T>M,则L≤M。T>M的情况,Y、U、D、V的表达方式同T≤M类似,本发明实施例不再赘述。
还需要说明的是,L可以等于M,本发明实施例也可以直接将第一矩阵V作为第三矩阵,同时,第四矩阵U作为矩阵U 1,第五矩阵D作为矩阵D 1
当需要预测的未来数据序列为历史数据序列之后的H个数据时,可以根据第一预测对象类的历史数据模式预测出第一预测对象类的未来数据模式,第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征。第一预测对象类的未来数据模式所组成的第二矩阵可以表示为:
Figure PCTCN2019084399-appb-000061
第三矩阵V 1中第r列数据组成的列向量v r,可以表示为:
v r=[v 1,r,v 2,r,...,v L,r];其中,r为正整数,r≤T。
预测的第二矩阵
Figure PCTCN2019084399-appb-000062
中第k列数据组成的列向量
Figure PCTCN2019084399-appb-000063
可以表示为:
Figure PCTCN2019084399-appb-000064
其中,k为正整数,k≤H。
可选地,如图8所示的第一种根据历史共同数据模式预测未来数据模式的原理示意图。计算设备可以根据第一预测对象类的历史共同数据模式训练出H个数据模式模型,该H个数据模式模型中的第k数据模式模型用于预测第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000065
中第k列数据;将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到所述H个数据模式模型中的第k数据模式模型,预测出第二矩阵
Figure PCTCN2019084399-appb-000066
中第k列数据,p为正整数,1<p<T,第三矩阵V 1的每一行组成一个历史共同数据模式;进而,将该H个数据模式模型所预测出的数据组合得到第二矩阵
Figure PCTCN2019084399-appb-000067
该第二矩阵
Figure PCTCN2019084399-appb-000068
的每一行数据组成一个未来数据模式。
具体地,步骤S32的一种实施方式可以包括:
步骤S321:建立初始模型:
初始模型可以是线性加权模型,也可以是自回归模型。该初始模型可以表示为:
Figure PCTCN2019084399-appb-000069
应理解,初始模型还可以具有其他形式,本申请实施例不作限定。
步骤S322:通过历史共同数据模式中第一部分数据训练该初始模型,得到数据模式模型。
具体地,将第三矩阵V 1中v s、v s-1、…、v s-p+1代入到初始模型,构建关于v s+k
Figure PCTCN2019084399-appb-000070
的损失函数
Figure PCTCN2019084399-appb-000071
通过使损失函数最小确定初始模型中的参数β k,0、β k,1、…、β k,p,进而,将确定的参数代入到初始模型中,得到数据模式模型。损失函数可以采用平方损失函数,计算初始模型中的参数可以采用最小二乘法或梯度下降法等、本申请实施例不作限定。
其中,历史共同数据模式中第一部分数据为样本数据,该第一部分数据为v s、v s-1、…、v s-p+1,其中,s+k≤T,p为正整数,p≤s。
步骤S323:将历史共同数据模式中第二部分数据代入到数据模式模型,得到未来数据模式。
其中,历史共同数据模式中第二部分数据为测试数据,该第二部分数据为v T、v T-1、…、v T-p+1
可以理解,令k取1至H,通过上述方法可以得到H个数据模式模型。
当k=1时,初始模型通过训练得到第一数据模式模型。该第一数据模式模型为:
Figure PCTCN2019084399-appb-000072
将历史数据v T、v T-1、…、v T-p+1输入到该第一数据模式模型确定的可得到
Figure PCTCN2019084399-appb-000073
Figure PCTCN2019084399-appb-000074
当k=2时,初始模型通过训练得到第二数据模式模型。该第二数据模式模型为:
Figure PCTCN2019084399-appb-000075
将历史数据v T、v T-1、…、v T-p+1输入到该第二数据模式模型确定的可得到
Figure PCTCN2019084399-appb-000076
Figure PCTCN2019084399-appb-000077
以此类推,当k=H时,初始模型通过训练得到第H数据模式模型。该第H数据模式模型为:
Figure PCTCN2019084399-appb-000078
将历史数据v T、v T-1、…、v T-p+1输入到该第二数据模式模型确定的可得到
Figure PCTCN2019084399-appb-000079
Figure PCTCN2019084399-appb-000080
进而,得到预测的未来数据模式组成的未来矩阵:
Figure PCTCN2019084399-appb-000081
其中,预测的未来数据模式
Figure PCTCN2019084399-appb-000082
中每一行为一个未来数据模式。
可选地,如图9所示的第二种根据历史共同数据模式预测未来数据模式的原理示意图。计算设备可以根据所述第一预测对象类的历史共同数据模式训练出数据模式模型;将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到所述数据模式模型,预测出所述第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000083
中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;所述第三矩阵V 1的每一行组成一个历史共同数据模式;进而,将k依次取1至H时所预测出的数据进行组合得到所述第二矩阵
Figure PCTCN2019084399-appb-000084
所述第二矩阵
Figure PCTCN2019084399-appb-000085
的每一行数据组成一个未来数据模式。
具体的,步骤S32的另一种实施方式可以是:
步骤S324:建立第一初始模型:
第一初始模型可以是线性加权模型,也可以是自回归模型。该第一初始模型可以表示为:
Figure PCTCN2019084399-appb-000086
步骤S325:通过历史共同数据模式中第三部分数据训练该初始模型,得到数据模式模型。
具体地,将历史共同模式矩阵中v s、v s-1、…、v s-p+1代入到第一初始模型,构建关于v s+H
Figure PCTCN2019084399-appb-000087
的损失函数
Figure PCTCN2019084399-appb-000088
通过使损失函数最小确定初始模型中的参数β H,0、β H,1、…、β H,p,进而,将确定的参数代入到第一初始模型中,得到数据模式模型。损失函数可以采用平方损失函数,计算第一初始模型中的参数可以采用最小二乘法或梯度下降法等、本申请实施例不作限定。
其中,历史共同数据模式中第三部分数据为样本数据,该第三部分数据为vs、vs-1、…、 vs-p+1,其中,s+H≤T,p为正整数,p≤s。
步骤S326:将历史共同数据模式中第四部分数据代入到数据模式模型,得到未来数据模式。
可以将第三矩阵V 1中v T-k+1、v T-k、…、v T-p+2-k代入该数据模式模型计算
Figure PCTCN2019084399-appb-000089
k为正整数,k≤H。
具体地,将v T v T-1 ... v T-p+1代入数据模式模型可得
Figure PCTCN2019084399-appb-000090
将v T-1 v T-2 ... v T-p代入数据模式模型可得
Figure PCTCN2019084399-appb-000091
以此类推,将v T-H+1 v T-H ... v T-H-p+2代入数据模式模型可得
Figure PCTCN2019084399-appb-000092
进而,将
Figure PCTCN2019084399-appb-000093
组合得到第二矩阵
Figure PCTCN2019084399-appb-000094
Figure PCTCN2019084399-appb-000095
应理解,该第四矩阵
Figure PCTCN2019084399-appb-000096
包括L个未来数据模式,未来模式矩阵
Figure PCTCN2019084399-appb-000097
中每一行元素表示一个未来数据模式。
本发明实施例中,仅仅需要训练一个数据模式模型,即可预测出未来数据模式。
本申请一实施例中,步骤S33的一种实施方式可以是:将矩阵U 1、矩阵D 1和第二矩阵
Figure PCTCN2019084399-appb-000098
相乘得到M个对象的未来数据矩阵
Figure PCTCN2019084399-appb-000099
即:
Figure PCTCN2019084399-appb-000100
根据公式(8)以及上述U 1、D 1
Figure PCTCN2019084399-appb-000101
可得:
Figure PCTCN2019084399-appb-000102
其中,未来数据矩阵
Figure PCTCN2019084399-appb-000103
未来数据矩阵
Figure PCTCN2019084399-appb-000104
中,对象i的未来数据序列可以表示为
Figure PCTCN2019084399-appb-000105
需要说明的是,当L=T时,
Figure PCTCN2019084399-appb-000106
具体可以参见上述相关描述,本申请实施例不再赘述。
还需要说明的是,H可以等于1,未来数据序列可以只包括一个数据。
应理解,计算设备或预测模块可以对K个预测对象类中任意一个或多个预测对象类中对象的未来数据序列进行预测。
采用某一公司多个产品实际的订单数据作为训练集,对产品的未来需求进行预测。实验结果证明,与图1所示现有技术或通过ARIMA模型预测相比,采用本申请数据序列预测方法,其预测准确率和订单满足率分别可以提升7%、5%左右。
其中,预测一致性,用于衡量在一段时间内,订单被满足的比例。该预测一致性可以表示为:
Figure PCTCN2019084399-appb-000107
当订单i被满足,则I i=1。Q为订单总数。
预测准确性,衡量在一段时间内,预测的未来数据序列和真实的数据序列的相近程度。该预测准确性可以表示为:
Figure PCTCN2019084399-appb-000108
其中,n为编码的个数。
现有技术中数据预测系统假定了该多个产品具有固定的产品层次结构,进而基于该固定的产品层次结构对预测值拆解或调整,以保证各个产品之间的预测一致性。当多个产品之间具有非固定的产品层次结构时,上述数据预测方法并不能保证各个产品之间的预测一致性。
本申请实施例,计算设备根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合,该相似距离用于表征两个对象的相似程度;进而,根据得到相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;再对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。实施本发明实施例,通过聚类算法,自动定义预测对象类,效率高且更加准确。
而且,在对同一预测对象类中对象的未来数据序列进行预测时,通过抽取历史数据模式、预测未来数据模式、进而根据未来数据模式还原出未来数据序列,提升了数据序列预测一致性和预测准确性。
下面介绍本申请实施例中涉及的装置。
请参阅图10,图10是本发明实施例提供的一种计算设备的结构示意图,该计算设备10可以包括:
距离计算单元101,用于根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,相似距离用于表征两个对象的相似程度,历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;
对象分类单元102,用于根据相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;K为正整数,K≤N;
预测单元103,用于对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
本申请一实施例中,距离计算单元101具体用于:
根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离;数据 相似距离用于表征两个对象分别对应的历史数据序列的相似程度;
计算N个对象中每两个对象之间的层次相似距离,层次相似距离用于表征两个对象在层次结构中所在层级的相似程度;
根据N个对象中每两个对象之间的数据相似距离和层次相似距离,得到相似距离集合,相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
本申请一实施例中,对象i和对象j为N个对象中的任意两个对象,对象i与对象j之间的相似距离通过下面公式计算:
Figure PCTCN2019084399-appb-000109
其中,y i为对象i的历史数据序列,y j为对象j的历史数据序列;d cor(y i,y j)为对象i与对象j之间的数据相似距离,d dis(y i,y j)为对象i与对象j的层次相似距离。
可选地,d cor(y i,y j)的计算公式为:
Figure PCTCN2019084399-appb-000110
其中,
Figure PCTCN2019084399-appb-000111
Cor(y i,y j)为对象i和对象j的皮尔逊相关性值;y it为对象i的历史数据序列中第t个数据;y jt为对象j的历史数据序列中第t个数据,t为正整数,t≤Q;Q为对象i中历史数据序列包含数据的个数,为正整数。
可选地,N个对象的层次结构为树形结构;其中,d dis(y i,y j)为对象i在树形结构中节点位置所属层级与对象j在树形结构中节点位置所属的层级之差。
本申请一实施例中,第一预测对象类为至少一个预测对象类中任意一个预测对象类;
预测单元103用于对第一预测对象类所包含对象的未来数据序列进行预测,包括用于:
根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,第一预测对象类的历史共同数据模式用于表示第一预测对象类中所有对象的历史数据序列的所包含的共同特征;
根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式;
根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列。
本申请一实施例中,第一预测对象类包括M个对象,M≤N,M为正整数,M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
预测单元103根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,包括用于:
将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,第一矩阵的逆矩阵为正交矩阵,第一矩阵的每一行数据组成一个历史数据模式;
从第一矩阵抽取出第1至第L个历史数据模式作为第一预测对象类的历史共同数据模式,L为正整数,L≤T。
本申请一实施例中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;
预测单元103根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式,包括用于:
根据第一预测对象类的历史共同数据模式训练出H个数据模式模型,H个数据模式模型中的第k数据模式模型用于预测第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000112
中第k列数据,k为正整数,k≤H,第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到H个数据模式模型中的第k数据模式模型,预测出第二矩阵
Figure PCTCN2019084399-appb-000113
中第k列数据,p为正整数,1<p<T,第三矩阵V 1的每一行组成一个历史共同数据模式;
将H个数据模式模型所预测出的数据组合得到第二矩阵
Figure PCTCN2019084399-appb-000114
第二矩阵
Figure PCTCN2019084399-appb-000115
的每一行数据组成一个未来数据模式。
本申请一实施例中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;预测单元103根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式,包括用于:
根据第一预测对象类的历史共同数据模式训练出数据模式模型;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到数据模式模型,预测出第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000116
中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;第三矩阵V 1的每一行组成一个历史共同数据模式;第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将k依次取1至H时所预测出的数据进行组合得到第二矩阵
Figure PCTCN2019084399-appb-000117
第二矩阵
Figure PCTCN2019084399-appb-000118
的每一行数据组成一个未来数据模式。
本申请一实施例中,预测单元103用于将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,第五矩阵D为对角矩阵;
预测单元103根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列,用于包括:
Figure PCTCN2019084399-appb-000119
其中,
Figure PCTCN2019084399-appb-000120
为第一预测对象类所包含对象的未来数据序列组成的矩阵;U 1为第四矩阵U的第1至L列数据组成的矩阵,D 1为第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。
本申请一实施例中,作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小,L可以选定为第五矩阵D中大于预设阈值的元素的个数,通过减少历史数据模式的个数减少运算量。
需要说明的是,各个单元的实现还可以对应参照方法实施例的相应描述,本申请实施例不再赘述。
请参阅图11,图11是本申请实施例提供的另一种计算设备的结构示意图该计算设备11包括处理器111和存储器112。处理器111通过总线113连接到存储器112。
存储器112可以包括只读存储器和随机存取存储器,并向处理器111提供指令和数据。存储器112的一部分还可以包括非易失性随机存取存储器(NVRAM)。
可选地,计算设备11还可以包括至少一个通信接口,该通信接口用于实现计算设备11与终端、服务器或其他计算设备等之间的数据交换。
处理器111可以是中央处理单元(Central Processing Unit,CPU),该处理器111还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
处理器111用于调用存储器112存储的程序代码执行:
根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,相似距离用于表征两个对象的相似程度,历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;
根据相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;K为正整数,K≤N;
对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
本申请一实施例中,处理器111执行根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合包括执行:
根据N个对象的历史数据序列计算N个对象中每两个对象之间的数据相似距离,数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度;
计算N个对象中每两个对象之间的层次相似距离,层次相似距离用于表征两个对象在层次结构中所在层级的相似程度;
根据N个对象中每两个对象之间的数据相似距离和层次相似距离,得到相似距离集合,相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
本申请一实施例中,对象i和对象j为N个对象中的任意两个对象,对象i与对象j之间的相似距离通过下面公式计算:
Figure PCTCN2019084399-appb-000121
其中,y i为对象i的历史数据序列,y j为对象j的历史数据序列;d cor(y i,y j)为对象i与对象j之间的数据相似距离,d dis(y i,y j)为对象i与对象j的层次相似距离。
本申请一实施例中,d cor(y i,y j)的计算公式为:
Figure PCTCN2019084399-appb-000122
其中,
Figure PCTCN2019084399-appb-000123
Cor(y i,y j)为对象i和对象j的皮尔逊相关性值;y it为对象i的历史数据序列中第t个数据;y jt为对象j的历史数据序列中第t个数据,t为正整数,t≤Q;Q为对象i中历史数据序列包含数据的个数,为正整数。
本申请一实施例中,N个对象的层次结构为树形结构;其中,d dis(y i,y j)为对象i在树形结构中节点位置所属层级与对象j在树形结构中节点位置所属的层级之差。
本申请一实施例中,第一预测对象类为至少一个预测对象类中任意一个预测对象类;处理器111执行对第一预测对象类中所包含对象的未来数据序列进行预测,包括执行:
根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,第一预测对象类的历史共同数据模式用于表示第一预测对象类中所有对象的历史数据序列的所包含的共同特征;
根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式;
根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列。
本申请一实施例中,第一预测对象类包括M个对象,M≤N,M为正整数,M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
处理器111执行根据第一预测对象类所包含对象的历史数据序列计算第一预测对象类的历史共同数据模式,包括执行:
将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,第一矩阵的逆矩阵为正交矩阵,第一矩阵的每一行数据组成一个历史数据模式;
从第一矩阵抽取出第1至第L个历史数据模式作为第一预测对象类的历史共同数据模式,L为正整数,L≤T。
本申请一实施例中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数;处理器111执行根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式包括执行:
根据第一预测对象类的历史共同数据模式训练出H个数据模式模型,H个数据模式模型中的第k数据模式模型用于预测第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000124
中第k列数据,k为正整数,k≤H,第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到H个数据模式模型中的第k数据模式模型,预测出第二矩阵
Figure PCTCN2019084399-appb-000125
中第k列数据,p为正整数,1<p<T,第三矩阵V 1的每一行组成一个历史共同数据模式;
将H个数据模式模型所预测出的数据组合得到第二矩阵
Figure PCTCN2019084399-appb-000126
第二矩阵
Figure PCTCN2019084399-appb-000127
的每一行数据组成一个未来数据模式。
本申请一实施例中,M个对象中每个对象的未来数据序列包括H个数据,H为正整数; 处理器111执行根据第一预测对象类的历史共同数据模式预测第一预测对象类的未来数据模式包括执行:
根据第一预测对象类的历史共同数据模式训练出数据模式模型;
将第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到数据模式模型,预测出第一预测对象类的未来数据模式所组成的第二矩阵
Figure PCTCN2019084399-appb-000128
中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;第三矩阵V 1的每一行组成一个历史共同数据模式;第一预测对象类的未来数据模式用于表示第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
将k依次取1至H时所预测出的数据进行组合得到第二矩阵
Figure PCTCN2019084399-appb-000129
第二矩阵
Figure PCTCN2019084399-appb-000130
的每一行数据组成一个未来数据模式。
本申请一实施例中,处理器111执行将M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,第五矩阵D为对角矩阵;
根据第一预测对象类的未来数据模式以及第一预测对象类所包含对象的历史数据序列预测第一预测对象类所包含对象的未来数据序列,具体包括:
Figure PCTCN2019084399-appb-000131
其中,
Figure PCTCN2019084399-appb-000132
为第一预测对象类所包含对象的未来数据序列组成的矩阵;U 1为第四矩阵U的第1至L列数据组成的矩阵,D 1为第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。
本申请一实施例中,作为对角矩阵的第五矩阵D对角线上的值随行数增大而减小,L可以选定为第五矩阵D中大于预设阈值的元素的个数,通过减少历史数据模式的个数减少运算量。
需要说明的是,各个单元的实现还可以对应参照上述方法实施例中的相应描述,本申请实施例不再赘述。
综上,本申请实施例根据N个对象的历史数据序列计算N个对象中每两个对象之间的相似距离,得到相似距离集合,该相似距离用于表征两个对象的相似程度;进而,根据得到相似距离集合,通过聚类算法将N个对象划分为K个预测对象类;再对K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。实施本发明实施例,通过聚类算法,自动定义预测对象类,效率高且更加准确。
而且,在对同一预测对象类中对象的未来数据序列进行预测时,通过抽取历史数据模式、预测未来数据模式、进而根据未来数据模式还原出未来数据序列,提升了数据序列预测一致性和预测准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例装置中的模块可以根据实际需要进行合并、划分和删减。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (34)

  1. 一种数据序列预测方法,其特征在于,包括:
    根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,所述相似距离用于表征两个对象的相似程度,所述历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;
    根据所述相似距离集合,通过聚类算法将所述N个对象划分为K个预测对象类;K为正整数,K≤N;
    对所述K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
  2. 如权利要求1所述的数据序列预测方法,其特征在于,所述根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离,得到相似距离集合包括:
    根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的数据相似距离,所述数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度;
    计算所述N个对象中每两个对象之间的层次相似距离,所述层次相似距离用于表征两个对象在层次结构中所在层级的相似程度;
    根据所述N个对象中每两个对象之间的数据相似距离和层次相似距离,得到所述相似距离集合,所述相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
  3. 如权利要求2所述的数据序列预测方法,其特征在于,对象i和对象j为所述N个对象中的任意两个对象,所述对象i与所述对象j之间的相似距离通过下面公式计算:
    Figure PCTCN2019084399-appb-100001
    其中,y i为所述对象i的历史数据序列,y j为所述对象j的历史数据序列;所述d cor(y i,y j)为所述对象i与所述对象j之间的数据相似距离,所述d dis(y i,y j)为所述对象i与所述对象j的层次相似距离。
  4. 如权利要求3所述的数据序列预测方法,其特征在于,所述d cor(y i,y j)的计算公式为:
    Figure PCTCN2019084399-appb-100002
    其中,
    Figure PCTCN2019084399-appb-100003
    所述Cor(y i,y j)为所述对象i和所述对象j的皮尔逊相关性值;y it为所述对象i的历史数据序列中第t个数据;y jt为所述对象j的历史数据序列中第t个数据,t为正整数,t≤Q;Q为所述对象i中历史数据序列包含 数据的个数,为正整数。
  5. 如权利要求3所述的数据序列预测方法,其特征在于,所述N个对象的层次结构为树形结构;其中,所述d dis(y i,y j)为所述对象i在所述树形结构中节点位置所属层级与所述对象j在所述树形结构中节点位置所属的层级之差。
  6. 如权利要求1-5任意一项权利要求所述的数据序列预测方法,其特征在于,所述第一预测对象类为所述至少一个预测对象类中任意一个预测对象类;
    对所述第一预测对象类中所包含对象的未来数据序列进行预测,包括:
    根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式,所述第一预测对象类的历史共同数据模式用于表示所述第一预测对象类中所有对象的历史数据序列的所包含的共同特征;
    根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式;
    根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列。
  7. 如权利要求6所述的数据序列预测方法,其特征在于,所述第一预测对象类包括M个对象,M≤N,M为正整数,所述M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
    所述根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式,包括:
    将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,所述第一矩阵的逆矩阵为正交矩阵,所述第一矩阵的每一行数据组成一个历史数据模式;
    从所述第一矩阵抽取出第1至第L个历史数据模式作为所述第一预测对象类的历史共同数据模式,L为正整数,L≤T。
  8. 如权利要求7所述的数据序列预测方法,其特征在于,所述M个对象中每个对象的未来数据序列包括H个数据,H为正整数;所述根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式包括:
    根据所述第一预测对象类的历史共同数据模式训练出H个数据模式模型,所述H个数据模式模型中的第k数据模式模型用于预测所述第一预测对象类的未来数据模式所组成的第二矩阵
    Figure PCTCN2019084399-appb-100004
    中第k列数据,k为正整数,k≤H,所述第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
    将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到所述H个数据模式模型中的第k数据模式模型,预测出所述第二矩阵
    Figure PCTCN2019084399-appb-100005
    中第 k列数据,p为正整数,1<p<T,所述第三矩阵V 1的每一行组成一个历史共同数据模式;
    将所述H个数据模式模型所预测出的数据组合得到所述第二矩阵
    Figure PCTCN2019084399-appb-100006
    所述第二矩阵
    Figure PCTCN2019084399-appb-100007
    的每一行数据组成一个未来数据模式。
  9. 如权利要求7所述的数据序列预测方法,其特征在于,所述M个对象中每个对象的未来数据序列包括H个数据,H为正整数;所述根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式包括:
    根据所述第一预测对象类的历史共同数据模式训练出数据模式模型;
    将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到所述数据模式模型,预测出所述第一预测对象类的未来数据模式所组成的第二矩阵
    Figure PCTCN2019084399-appb-100008
    中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;所述第三矩阵V 1的每一行组成一个历史共同数据模式;所述第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
    将k依次取1至H时所预测出的数据进行组合得到所述第二矩阵
    Figure PCTCN2019084399-appb-100009
    所述第二矩阵
    Figure PCTCN2019084399-appb-100010
    的每一行数据组成一个未来数据模式。
  10. 如权利要求8或9所述的数据序列预测方法,其特征在于,所述将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,所述第五矩阵D为对角矩阵;
    所述根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列,具体包括:
    Figure PCTCN2019084399-appb-100011
    其中,
    Figure PCTCN2019084399-appb-100012
    为所述第一预测对象类所包含对象的未来数据序列组成的矩阵;所述U 1为所述第四矩阵U的第1至L列数据组成的矩阵,所述D 1为所述第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。
  11. 如权利要求10所述的数据序列预测方法,其特征在于,所述L为所述第五矩阵D中大于预设阈值的元素的个数。
  12. 一种计算设备,其特征在于,包括:
    距离计算单元,用于根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,所述相似距离用于表征两个对象的相似程度,所述历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;
    对象分类单元,用于根据所述相似距离集合,通过聚类算法将所述N个对象划分为K个预测对象类;K为正整数,K≤N;
    预测单元,用于对所述K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
  13. 如权利要求12所述的计算设备,其特征在于,所述距离计算单元具体用于:
    根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的数据相似距离;所述数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度;
    计算所述N个对象中每两个对象之间的层次相似距离,所述层次相似距离用于表征两个对象在层次结构中所在层级的相似程度;
    根据所述N个对象中每两个对象之间的数据相似距离和层次相似距离,得到所述相似距离集合,所述相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
  14. 如权利要求13所述的计算设备,其特征在于,对象i和对象j为所述N个对象中的任意两个对象,所述对象i与所述对象j之间的相似距离通过下面公式计算:
    Figure PCTCN2019084399-appb-100013
    其中,y i为所述对象i的历史数据序列,y j为所述对象j的历史数据序列;所述d cor(y i,y j)为所述对象i与所述对象j之间的数据相似距离,所述d dis(y i,y j)为所述对象i与所述对象j的层次相似距离。
  15. 如权利要求14所述的计算设备,其特征在于,所述d cor(y i,y j)的计算公式为:
    Figure PCTCN2019084399-appb-100014
    其中,
    Figure PCTCN2019084399-appb-100015
    所述Cor(y i,y j)为所述对象i和所述对象j的皮尔逊相关性值;y it为所述对象i的历史数据序列中第t个数据;y jt为所述对象j的历史数据序列中第t个数据,t为正整数,t≤Q;Q为所述对象i中历史数据序列包含数据的个数,为正整数。
  16. 如权利要求14所述的计算设备,其特征在于,所述N个对象的层次结构为树形结构;其中,所述d dis(y i,y j)为所述对象i在所述树形结构中节点位置所属层级与所述对象j在所述树形结构中节点位置所属的层级之差。
  17. 如权利要求12-16任意一项权利要求所述的计算设备,其特征在于,所述第一预测对象类为所述至少一个预测对象类中任意一个预测对象类;
    所述预测单元用于对所述第一预测对象类所包含对象的未来数据序列进行预测,具体用于:
    根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式,所述第一预测对象类的历史共同数据模式用于表示所述第一预测对象类中所有对象的历史数据序列的所包含的共同特征;
    根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式;
    根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列。
  18. 如权利要求17所述的计算设备,其特征在于,所述第一预测对象类包括M个对象,M≤N,M为正整数,所述M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
    所述预测单元根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式,包括用于:
    将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,所述第一矩阵的逆矩阵为正交矩阵,所述第一矩阵的每一行数据组成一个历史数据模式;
    从所述第一矩阵抽取出第1至第L个历史数据模式作为所述第一预测对象类的历史共同数据模式,L为正整数,L≤T。
  19. 如权利要求18所述的计算设备,其特征在于,所述M个对象中每个对象的未来数据序列包括H个数据,H为正整数;
    所述预测单元根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式,包括用于:
    根据所述第一预测对象类的历史共同数据模式训练出H个数据模式模型,所述H个数据模式模型中的第k数据模式模型用于预测所述第一预测对象类的未来数据模式所组成的第二矩阵
    Figure PCTCN2019084399-appb-100016
    中第k列数据,k为正整数,k≤H,所述第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
    将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到所述H个数据模式模型中的第k数据模式模型,预测出所述第二矩阵
    Figure PCTCN2019084399-appb-100017
    中第k列数据,p为正整数,1<p<T,所述第三矩阵V 1的每一行组成一个历史共同数据模式;
    将所述H个数据模式模型所预测出的数据组合得到所述第二矩阵
    Figure PCTCN2019084399-appb-100018
    所述第二矩阵
    Figure PCTCN2019084399-appb-100019
    的每一行数据组成一个未来数据模式。
  20. 如权利要求18所述的计算设备,其特征在于,所述M个对象中每个对象的未来数据序列包括H个数据,H为正整数;所述预测单元根据所述第第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式,包括用于:
    根据所述第一预测对象类的历史共同数据模式训练出数据模式模型;
    将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到所述数据模式模型,预测出所述第一预测对象类的未来数据模式所组成的第二矩阵
    Figure PCTCN2019084399-appb-100020
    中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;所述第三矩阵V 1的每一行组成一个历史共同数据模式;所述第一预测对象类的未来数据模式用于表示所 述第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
    将k依次取1至H时所预测出的数据进行组合得到所述第二矩阵
    Figure PCTCN2019084399-appb-100021
    所述第二矩阵
    Figure PCTCN2019084399-appb-100022
    的每一行数据组成一个未来数据模式。
  21. 如权利要求19或20所述的计算设备,其特征在于,所述预测单元用于将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,所述第五矩阵D为对角矩阵;
    所述预测单元根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列,用于包括:
    Figure PCTCN2019084399-appb-100023
    其中,
    Figure PCTCN2019084399-appb-100024
    为所述第一预测对象类所包含对象的未来数据序列组成的矩阵;所述U 1为所述第四矩阵U的第1至L列数据组成的矩阵,所述D 1为所述第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。
  22. 如权利要求21所述的计算设备,其特征在于,所述L为所述第五矩阵D中大于预设阈值的元素的个数。
  23. 一种计算设备,其特征在于,包括处理器和存储器,所述处理器连接到所述存储器,所述处理器用于调用所述存储器存储的程序代码执行:
    根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离,得到相似距离集合,其中,所述相似距离用于表征两个对象的相似程度,所述历史数据序列包括按照预设规律排列的多个数据,N为大于1的正整数;
    根据所述相似距离集合,通过聚类算法将所述N个对象划分为K个预测对象类;K为正整数,K≤N;
    对所述K个预测对象类中至少一个预测对象类所包含对象的未来数据序列进行预测。
  24. 如权利要求23所述的计算设备,其特征在于,所述处理器执行所述根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的相似距离,得到相似距离集合包括执行:
    根据N个对象的历史数据序列计算所述N个对象中每两个对象之间的数据相似距离,所述数据相似距离用于表征两个对象分别对应的历史数据序列的相似程度;
    计算所述N个对象中每两个对象之间的层次相似距离,所述层次相似距离用于表征两个对象在层次结构中所在层级的相似程度;
    根据所述N个对象中每两个对象之间的数据相似距离和层次相似距离,得到所述相似距离集合,所述相似距离集合中的任一相似距离包括对应的数据相似距离和层次相似距离。
  25. 如权利要求24所述的计算设备,其特征在于,对象i和对象j为所述N个对象中的任意两个对象,所述对象i与所述对象j之间的相似距离通过下面公式计算:
    Figure PCTCN2019084399-appb-100025
    其中,y i为所述对象i的历史数据序列,y j为所述对象j的历史数据序列;所述d cor(y i,y j)为所述对象i与所述对象j之间的数据相似距离,所述d dis(y i,y j)为所述对象i与所述对象j的层次相似距离。
  26. 如权利要求25所述的计算设备,其特征在于,所述d cor(y i,y j)的计算公式为:
    Figure PCTCN2019084399-appb-100026
    其中,
    Figure PCTCN2019084399-appb-100027
    所述Cor(y i,y j)为所述对象i和所述对象j的皮尔逊相关性值;y it为所述对象i的历史数据序列中第t个数据;y jt为所述对象j的历史数据序列中第t个数据,t为正整数,t≤Q;Q为所述对象i中历史数据序列包含数据的个数,为正整数。
  27. 如权利要求25所述的计算设备,其特征在于,所述N个对象的层次结构为树形结构;其中,所述d dis(y i,y j)为所述对象i在所述树形结构中节点位置所属层级与所述对象j在所述树形结构中节点位置所属的层级之差。
  28. 如权利要求23-27任意一项权利要求所述的计算设备,其特征在于,所述第一预测对象类为所述至少一个预测对象类中任意一个预测对象类;
    所述处理器执行所述对所述第一预测对象类中所包含对象的未来数据序列进行预测,包括执行:
    根据所述第一预测对象类所包含对象的历史数据序列计算所述第一预测对象类的历史共同数据模式,所述第一预测对象类的历史共同数据模式用于表示所述第一预测对象类中所有对象的历史数据序列的所包含的共同特征;
    根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式;
    根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列。
  29. 如权利要求28所述的计算设备,其特征在于,所述第一预测对象类包括M个对象,M≤N,M为正整数,所述M个对象中每个对象的历史数据序列包括T个数据,T为大于1的正整数;
    所述处理器执行所述根据所述第一预测对象类所包含对象的历史数据序列计算所述第 一预测对象类的历史共同数据模式,包括执行:
    将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,得到T×T阶的第一矩阵,其中,所述第一矩阵的逆矩阵为正交矩阵,所述第一矩阵的每一行数据组成一个历史数据模式;
    从所述第一矩阵抽取出第1至第L个历史数据模式作为所述第一预测对象类的历史共同数据模式,L为正整数,L≤T。
  30. 如权利要求29所述的计算设备,其特征在于,所述M个对象中每个对象的未来数据序列包括H个数据,H为正整数;所述处理器执行所述根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式包括执行:
    根据所述第一预测对象类的历史共同数据模式训练出H个数据模式模型,所述H个数据模式模型中的第k数据模式模型用于预测所述第一预测对象类的未来数据模式所组成的第二矩阵
    Figure PCTCN2019084399-appb-100028
    中第k列数据,k为正整数,k≤H,所述第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
    将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T列至第T-p+1列数据输入到所述H个数据模式模型中的第k数据模式模型,预测出所述第二矩阵
    Figure PCTCN2019084399-appb-100029
    中第k列数据,p为正整数,1<p<T,所述第三矩阵V 1的每一行组成一个历史共同数据模式;
    将所述H个数据模式模型所预测出的数据组合得到所述第二矩阵
    Figure PCTCN2019084399-appb-100030
    所述第二矩阵
    Figure PCTCN2019084399-appb-100031
    的每一行数据组成一个未来数据模式。
  31. 如权利要求29所述的计算设备,其特征在于,所述M个对象中每个对象的未来数据序列包括H个数据,H为正整数;所述处理器执行所述根据所述第一预测对象类的历史共同数据模式预测所述第一预测对象类的未来数据模式包括执行:
    根据所述第一预测对象类的历史共同数据模式训练出数据模式模型;
    将所述第一预测对象类的历史共同数据模式所组成的第三矩阵V 1中第T-H+k列至第T-H+k-p+1列数据输入到所述数据模式模型,预测出所述第一预测对象类的未来数据模式所组成的第二矩阵
    Figure PCTCN2019084399-appb-100032
    中第k列数据,k、p为正整数,k≤H,T-H+k-p≥1;所述第三矩阵V 1的每一行组成一个历史共同数据模式;所述第一预测对象类的未来数据模式用于表示所述第一预测对象类中所有对象的未来数据序列的所包含的共同特征;
    将k依次取1至H时所预测出的数据进行组合得到所述第二矩阵
    Figure PCTCN2019084399-appb-100033
    所述第二矩阵
    Figure PCTCN2019084399-appb-100034
    的每一行数据组成一个未来数据模式。
  32. 如权利要求30或31所述的计算设备,其特征在于,所述处理器执行所述将所述M个对象的历史数据序列组成的M×T阶矩阵进行奇异值分解,还得到M×M阶的第四矩阵U和M×T阶的第五矩阵D,其中,第四矩阵U为正交矩阵,所述第五矩阵D为对角矩阵;
    所述处理器执行所述根据所述第一预测对象类的未来数据模式以及所述第一预测对象类所包含对象的历史数据序列预测所述第一预测对象类所包含对象的未来数据序列,具体 执行:
    Figure PCTCN2019084399-appb-100035
    其中,
    Figure PCTCN2019084399-appb-100036
    为所述第一预测对象类所包含对象的未来数据序列组成的矩阵;所述U 1为所述第四矩阵U的第1至L列数据组成的矩阵,所述D 1为所述第五矩阵D的第1至L行数据中的第1至L列的数据组成的矩阵。
  33. 如权利要求32所述的计算设备,其特征在于,所述L为所述第五矩阵D中大于预设阈值的元素的个数。
  34. 一种计算机存储介质,其特征在于,所述计算机存储介质用于计算机软件指令,所述计算机软件指令当被计算机执行时使所述计算机执行如权利要求1-11中任一权利要求所述的数据序列预测方法。
PCT/CN2019/084399 2018-05-10 2019-04-25 一种数据序列预测方法及计算设备 WO2019214455A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/038,635 US20210012152A1 (en) 2018-05-10 2020-09-30 Data Sequence Prediction Method and Computing Device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810445781.3A CN110019420B (zh) 2018-05-10 2018-05-10 一种数据序列预测方法及计算设备
CN201810445781.3 2018-05-10

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/038,635 Continuation US20210012152A1 (en) 2018-05-10 2020-09-30 Data Sequence Prediction Method and Computing Device

Publications (1)

Publication Number Publication Date
WO2019214455A1 true WO2019214455A1 (zh) 2019-11-14

Family

ID=67188301

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/084399 WO2019214455A1 (zh) 2018-05-10 2019-04-25 一种数据序列预测方法及计算设备

Country Status (3)

Country Link
US (1) US20210012152A1 (zh)
CN (1) CN110019420B (zh)
WO (1) WO2019214455A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111445460A (zh) * 2020-03-30 2020-07-24 上海眼控科技股份有限公司 雷达云图的预测方法、装置、计算机设备和存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111210071B (zh) * 2020-01-03 2023-11-24 深圳前海微众银行股份有限公司 业务对象预测方法、装置、设备及可读存储介质
CN113392533B (zh) * 2021-06-25 2022-05-27 湖南联智科技股份有限公司 一种基于arima模型及x-11分解的gnss定位数据后处理方法
CN113537588B (zh) * 2021-07-13 2024-02-02 杭州安恒信息技术股份有限公司 一种人数预测方法、装置、设备及计算机可读存储介质
CN113506138A (zh) * 2021-07-16 2021-10-15 瑞幸咖啡信息技术(厦门)有限公司 业务对象的数据预估方法、装置、设备及存储介质
CN113850439A (zh) * 2021-09-29 2021-12-28 广州新科佳都科技有限公司 轨道交通站点设备能耗预测方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999791A (zh) * 2012-11-23 2013-03-27 广东电网公司电力科学研究院 一种电力行业中基于客户分群的电力负荷预测方法
CN104281891A (zh) * 2014-10-13 2015-01-14 安徽华贞信息科技有限公司 一种时间序列数据挖掘方法及系统
CN104834967A (zh) * 2015-04-24 2015-08-12 南京邮电大学 泛在网络下基于用户相似度的业务行为预测方法
CN105956699A (zh) * 2016-04-29 2016-09-21 连云港天马网络发展有限公司 基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法
CN106778838A (zh) * 2016-11-29 2017-05-31 北京科技大学 一种预测空气质量的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999791A (zh) * 2012-11-23 2013-03-27 广东电网公司电力科学研究院 一种电力行业中基于客户分群的电力负荷预测方法
CN104281891A (zh) * 2014-10-13 2015-01-14 安徽华贞信息科技有限公司 一种时间序列数据挖掘方法及系统
CN104834967A (zh) * 2015-04-24 2015-08-12 南京邮电大学 泛在网络下基于用户相似度的业务行为预测方法
CN105956699A (zh) * 2016-04-29 2016-09-21 连云港天马网络发展有限公司 基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法
CN106778838A (zh) * 2016-11-29 2017-05-31 北京科技大学 一种预测空气质量的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WANG, JIANWEI: "Online Sales Volume Prediction Based on Items Clustering", COMPUTER SYSTEMS & APPLICATIONS, vol. 25, no. 10, 31 October 2016 (2016-10-31), pages 162 - 168 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111445460A (zh) * 2020-03-30 2020-07-24 上海眼控科技股份有限公司 雷达云图的预测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN110019420A (zh) 2019-07-16
US20210012152A1 (en) 2021-01-14
CN110019420B (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
WO2019214455A1 (zh) 一种数据序列预测方法及计算设备
US11281969B1 (en) Artificial intelligence system combining state space models and neural networks for time series forecasting
Fang et al. Performance enhancing techniques for deep learning models in time series forecasting
WO2019056499A1 (zh) 预测模型训练方法、数据监控方法、装置、设备及介质
Ren et al. TBSM: A traffic burst-sensitive model for short-term prediction under special events
US11928616B2 (en) Method and system for hierarchical forecasting
Kaur et al. Energy forecasting in smart grid systems: A review of the state-of-the-art techniques
CN113962294B (zh) 多类型事件预测模型
CN114971748B (zh) 预测数据生成、模型训练方法、计算机设备以及存储介质
CN110796513A (zh) 多任务学习方法、装置、电子设备及存储介质
CN113240153A (zh) 光伏发电数据预测方法、装置、计算设备及存储介质
Yeze et al. Stock price prediction based on information entropy and artificial neural network
CN112132356A (zh) 一种基于时空图注意力机制的股价预测方法
WO2023050534A1 (zh) 轨道交通站点设备能耗预测方法、装置、设备和存储介质
CN112651534A (zh) 一种预测资源供应链需求量的方法、装置及存储介质
CN114118570A (zh) 业务数据预测方法及装置、电子设备和存储介质
CN112348590A (zh) 一种物品价值确定方法、装置、电子设备和存储介质
CN116993185A (zh) 时间序列预测方法、装置、设备及存储介质
CN111860998A (zh) 股票交易数据的预测方法、装置、电子设备及介质
Huynh et al. Causal inference in econometrics
CN116739649A (zh) 一种用户响应潜力评估方法和装置
CN115965160A (zh) 一种数据中心能耗预测方法、装置、存储介质及电子设备
CN114282657A (zh) 一种市场数据长期预测模型训练方法、装置、设备及存储介质
Chen Fitting an uncertain productivity learning process using an artificial neural network approach
CN112330017A (zh) 电力负荷预测方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19800825

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19800825

Country of ref document: EP

Kind code of ref document: A1