CN114925811A - 一种多变量时间序列处理方法、装置、设备及介质 - Google Patents

一种多变量时间序列处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN114925811A
CN114925811A CN202210529330.4A CN202210529330A CN114925811A CN 114925811 A CN114925811 A CN 114925811A CN 202210529330 A CN202210529330 A CN 202210529330A CN 114925811 A CN114925811 A CN 114925811A
Authority
CN
China
Prior art keywords
time
time sequence
multivariate
cause
moment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210529330.4A
Other languages
English (en)
Inventor
孙阳
解一凡
刘康
罗旋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Volcano Engine Technology Co Ltd
Original Assignee
Beijing Volcano Engine Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Volcano Engine Technology Co Ltd filed Critical Beijing Volcano Engine Technology Co Ltd
Priority to CN202210529330.4A priority Critical patent/CN114925811A/zh
Publication of CN114925811A publication Critical patent/CN114925811A/zh
Priority to PCT/CN2023/088339 priority patent/WO2023221701A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种多变量时间序列处理方法,为挖掘多变量时间序列中各变量之间的因果关系,获取时间序列集合,该时间序列集合中包括多个第一时间序列片段。其中,每个第一时间序列片段的长度相同且为多变量时间序列。针对任一第一时间序列片段,将该第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值。其中,第一时刻为与所述第一时间序列片段中最晚时刻相邻的下一时刻。基于多个第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签(真实值)确定优化函数,该优化函数包括图神经网络的损失函数以及因果矩阵。以最小化优化函数为目标确定因果矩阵中各参数的取值,并根据各参数的取值确定多变量之间的因果关系。

Description

一种多变量时间序列处理方法、装置、设备及介质
技术领域
本申请涉及计算机技术领域,具体涉及一种多变量时间序列处理方法、装置、设备及介质。
背景技术
时间序列是指将某种统计指标的数值按照时间先后顺序排序形成的序列。通常情况下,时间序列可以分为单变量时间序列和多变量时间序列。其中,多变量时间序列是指在同一时间点存在多个不同的统计指标的值。关于多变量时间序列的研究主要包括预测、异常检测、因果挖掘等,其中因果挖掘是指挖掘多个变量之间的影响关系。
目前,针对多变量时间序列的分析主要针对的是具有简单线性关系的多变量的研究,无法对具有非线性依赖关系的多变量时间序列进行有效分析。
发明内容
有鉴于此,本申请提供一种多变量时间序列处理方法、装置、设备及介质,以实现对具有非线性关系的多变量时间序列进行处理。
为实现上述目的,本申请提供的技术方案如下:
在本申请第一方面,提供了一种多变量时间序列处理方法,其特征在于,所述方法包括:
获取时间序列集合,所述时间序列集合中包括多个第一时间序列片段,所述多个第一时间序列片段中每个第一时间序列片段的长度相同,所述第一时间序列片段为多变量时间序列;
针对所述时间序列集合中的任一第一时间序列片段,将所述第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值,所述第一时刻为与所述第一时间序列片段中最晚时刻相邻的下一时刻;
根据多个所述第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签确定优化函数,所述优化函数包括所述图神经网络的损失函数和因果矩阵;
以最小化所述优化函数为目标,确定所述因果矩阵中各参数的取值;
根据所述因果矩阵中各参数的取值确定所述多变量时间序列中多变量之间的因果关系。
在本申请第二方面,提供了一种多变量时间序列处理装置,所述装置包括:
获取单元,用于获取时间序列集合,所述时间序列集合中包括多个第一时间序列片段,所述多个第一时间序列片段中每个第一时间序列片段的长度相同,所述第一时间序列片段为多变量时间序列;
预测单元,用于针对所述时间序列集合中的任一第一时间序列片段,将所述第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值,所述第一时刻为与所述第一时间序列片段中最晚时刻相邻的下一时刻;
确定单元,用于根据多个所述第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签确定优化函数,所述优化函数包括所述图神经网络的损失函数和因果矩阵;
所述确定单元,还用于以最小化所述优化函数为目标,确定所述因果矩阵中各参数的取值;
所述确定单元,还用于根据所述因果矩阵中各参数的取值确定所述多变量时间序列中多变量之间的因果关系。
在本申请第三方面,提供了一种电子设备,所述设备包括:处理器和存储器;所述存储器,用于存储指令或计算机程序;所述处理器,用于执行所述存储器中的所述指令或计算机程序,以使得所述电子设备执行第一方面所述的方法。
在本申请第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在设备上运行时,使得所述设备执行第一方面所述的方法。
在本申请第五方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现所述执行第一方面所述的方法。
由此可见,本申请实施例具有如下有益效果:
本申请中为挖掘多变量时间序列中各变量之间的因果关系,获取时间序列集合,该时间序列集合中包括多个第一时间序列片段。其中,每个第一时间序列片段的长度相同且为多变量时间序列。针对时间序列集合中的任一第一时间序列片段,将该第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值。其中,第一时刻为与所述第一时间序列片段中最晚时刻相邻的下一时刻。即利用第一时间序列片段各变量的参数值预测下一时刻各变量的参数值。基于多个第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签(真实值)确定优化函数,该优化函数包括图神经网络的损失函数以及因果矩阵。以最小化优化函数为目标确定因果矩阵中各参数的取值,并根据各参数的取值确定多变量之间的因果关系。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种时间序列示意图;
图2为本申请实施例提供的一种多变量时间序列处理方法流程图;
图3a为本申请实施例提供的一种获取第一时间序列片段示意图;
图3b为本申请实施例提供的另一种获取第一时间序列片段示意图;
图4为本申请实施例提供的一种图神经网络结构示意图;
图5为本申请实施例提供的另一种多变量时间序列处理方法流程图;
图6为本申请实施例提供的一种获取第二时间序列片段示意图;
图7为本申请实施例提供的一种多变量时间序列处理装置示意图;
图8为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为解决时间序列中各变量之间的因果推断问题,本申请实施例提供了一种基于图神经网络的因果结构挖掘方法,通过挖掘时间序列中各变量之间的因果关系,分析变量之间的时滞效应。
为便于理解,参见图1所示的应用场景图,如图1所示,在该应用场景下时间序列包括4个变量,分别为x1、x2、x3和x4。图(a)为正常的时间序列、(b)为离散化的时间序列,通过挖掘获得(c)所指示的有向图。通过该有向图(c)可以确定影响
Figure BDA0003645932470000047
Figure BDA0003645932470000048
的因素。
即通过本申请提供的技术方案,不仅可以挖掘多变量存在因果关系,还可以确定影响程度以及最大影响迟滞数,例如图(c)中各个边的取值。如影响
Figure BDA0003645932470000041
的变量有
Figure BDA0003645932470000042
最大影响迟滞数为2。影响
Figure BDA0003645932470000043
的变量有
Figure BDA0003645932470000044
Figure BDA0003645932470000045
Figure BDA0003645932470000046
最大影响迟滞数为2。
需要说明的是,本申请暂不考虑变量间的同期作用。例如,不考虑
Figure BDA00036459324700000411
Figure BDA0003645932470000049
Figure BDA00036459324700000410
之间的影响。
基于上述场景,下面将结合附图对本申请实施例提供的多变量时间序列处理方法进行说明。
参见图2,该图为本申请实施例提供的一种多变量时间序列处理方法流程图,该方法可以由处理设备执行,该处理设备可以为服务器,也可以为电子设备,还可以为其他设备,在此不作限制。其中,服务器可以是云服务器或者服务器集群等具有存储及计算功能的设备。电子设备可以包括移动电话、平板电脑、台式计算机、笔记本电脑、车载终端、可穿戴电子设备、一体机、智能家居设备等具有通信功能的设备,也可以是虚拟机或者模拟器模拟的设备。如图2所示,该方法可以包括如下步骤:
S201:获取时间序列集合,该时间序列集合中包括多个第一时间序列片段。
本实施例中,在获取时间序列后,可以按照预设时长对该时间序列进行划分以获得多个第一时间序列片段。其中,多个第一时间序列片段中每个第一时间序列片段的长度相同,且第一时间序列片段为多变量时间序列。例如图3a所示,获取t-n至t时刻的时间序列,该时间序列包括变量x1、x2、x3....,等长度地将时间序列划分为时间序列片段1、时间序列片段2、时间序列片段3和时间序列片段4。其中,预设时长可以根据实际应用情况设定,本实施例在此不再限定。
可选地,预先设置观察窗口,通过滑动观察窗口获得多个第一时间序列片段。具体地,获取观察窗口和滑动步长,将观察窗口按照滑动步长在时间序列上进行滑动获得多个第一时序列片段。其中,观察窗口的长度和滑动步长可以根据实际应用情况确定。例如,观察窗口So=3、滑动步长为1。例如图3b所示,实线观察窗口为划分出一个第一时间序列片段,向右移动预设的滑动步长得到虚线观察窗口,该虚线观察窗口为另一个第一时间序列片段。
需要说明的是,观察窗口的长度大于等于估计的最大时滞值。例如,估计的最大时滞值为3,即t-3时刻的变量对t时刻的变量有影响,则观察窗口的长度至少为3。
S202:针对时间序列集合中的任一第一时间序列片段,将第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值。
在获得时间序列集合后,针对该时间序列集合中的每个第一时间序列片段,将该第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值。其中,第一时刻为与第一时间序列片段中最晚时刻相邻的下一时刻。例如,第一时间序列片段对应的时间为t-n至t-n-5,则第一时刻为t-n-6。即利用t-n至t-n-5时间段内的时间序列片段预测下一时刻各变量的参数值。即,通过图神经网络可以预测每个第一时间序列片段的下一时刻对应的各变量参数值。
具体地,为挖掘时间序列中各变量之间的因果关系,本实施例构建结构因果模型,该模型的表达形式如下:
Figure BDA0003645932470000051
其中,Xt-τ表示第一时间序列片段、Aτ表示因果矩阵,该因果矩阵包括各变量之间的影响因子。例如,因果矩阵中包括图1(c)中a12 2和a32 1。Zt表示t时刻各个变量对应的噪声,τ=1,…,p,p表示最大时滞值。例如图1中,p=3。
具体地,上述公式(1)通过整合,可以表示如下:
Figure BDA0003645932470000061
其中,
Figure BDA0003645932470000062
Figure BDA0003645932470000063
具体地一般表达形式如下:
Figure BDA0003645932470000064
求解
Figure BDA0003645932470000065
若其某元素非零,则表明对应变量间存在特定时滞值的影响关系。
可选地,可以通过以下方式预测第一时刻对应的多变量参数值:将第一时间序列片段以及第一时刻的多变量序列标签输入图神经网络的编码器,获得各变量对应的噪声特征以及第一时刻各变量的预测特征;将第一时刻各变量的预测特征与各变量对应的噪声特征输入图神经网络的解码器,获得第一时刻对应的多变量参数值。其中,第一时刻的多变量序列标签是指第一时刻的各变量对应的真实序列值。
其中,图神经网络的结构如图4所示,包括节点嵌入模块(node embedding,NE)、边神经网络(edge neural network,ENN)和节点神经网络(node neural network,NNN)。其中,NE通过利用多层感知机((multilayer perceptron,MLP)将节点信息映射到特征空间;ENN将边所表示的因果关系以及时滞信息编码为边特征,与节点特征拼接,和
Figure BDA0003645932470000069
做点乘,更新边特征;NNN通过聚合函数将边特征传递到下一节点。
其中,NE所对应的表示形式如下:
hit=femb(xit) (4)
ENN对应的表示形式如下:
Figure BDA0003645932470000066
NNN对应的表示形式如下:
Figure BDA0003645932470000067
其中,x表示原始结点特征,h表示结点或边的嵌入,fcmb、fτ表示MLP,fe、fv可以是MLP层或恒等映射等,l是迭代次数。其中,fv的计算结果相当于上述公式(2)中
Figure BDA0003645932470000068
其中,编码器输出的结果为:Zt=F1(F2(Xt)-G(X))。
解码器对应的输出结果为:xt’=F3(G(X)+F4(Zt))。
通过图4可知,模型输入的是X+Xt,其中,X表示第一时间序列片段,Xt表示第一时刻对应的真实序列值,用于确定噪声Zt。模型输出的是Xt’,表示预测出的第一时刻下各变量参数值。
S203:根据多个第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签确定优化函数。
在基于每个第一时间序列预测出对应的第一时刻对应的多变量参数值后,根据多个第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签确定优化函数,该优化函数包括图神经网络的损失函数和因果矩阵。其中,因果矩阵中各参数用于反映变量之间是否存在影响。
具体地,优化函数表示如下:
Figure BDA0003645932470000071
其中,
Figure BDA0003645932470000073
指示图神经网络的损失函数,n表示输入模型的样本数,即时间序列集合中的第一时间序列片段的数量,λ稀疏性系数。
其中,图神经网络的损失函数可以根据实际应用进行选择,例如均方误差(Meansquared error)、交叉熵代价函数(Cross-entropy cost function)等。
S204:以最小化优化函数为目标,确定因果矩阵中各参数的取值。
在确定出优化函数后,以最小化优化函数为目标,对上述优化函数进行求解,从而确定因果均值中各参数的取值。
具体地,如公式(8)所示:
Figure BDA0003645932470000072
S205:根据因果矩阵中各参数的取值确定多变量时间序列中多变量之间的因果关系。
在确定出因果矩阵中各参数的取值后,根据各参数的取值确定多变量时间序列中各变量之间的因果关系。具体地,当某一参数的取值为零时,表示该参数对应的变量对第一时刻中所求解的变量无影响。当某一参数的取值非零时,确定多变量之间存在时滞因果关系。
可选地,在根据因果矩阵的参数取值确定各变量之间的因果关系时,先判断因果矩阵中参数的取值是否小于预设阈值,如果是,则将该参数的取值置为0。具体地,确定所述因果矩阵中的取值小于预设阈值的目标参数;将所述目标参数的取值置为0。
可见,为挖掘多变量时间序列中各变量之间的因果关系,获取时间序列集合,该时间序列集合中包括多个第一时间序列片段。其中,每个第一时间序列片段的长度相同且为多变量时间序列。针对时间序列集合中的任一第一时间序列片段,将该第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值。其中,第一时刻为与所述第一时间序列片段中最晚时刻相邻的下一时刻。即利用第一时间序列片段各变量的参数值预测下一时刻各变量的参数值。基于多个第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签(真实值)确定优化函数,该优化函数包括图神经网络的损失函数以及因果矩阵。以最小化优化函数为目标确定因果矩阵中各参数的取值,并根据各参数的取值确定多变量之间的因果关系。
通过上述实施例可知,在确定优化函数之前,根据第一时间序列片段进行了一次预测,为进一步地挖掘多变量时间序列中各变量之间的因果关系,可以进行多次预测,以根据多次预测结果确定优化函数。具体地,下面以预测两次为例进行说明,即预测窗口的长度为2。
参见图5,该图为本申请实施例提供的另一种多变量时间序列处理方法流程图,如图5所示,该方法包括:
S501:获取时间序列集合,该时间序列集合中包括多个第一时间序列片段。
其中,关于S501的具体实现可以参见上述S201的相关描述,本实施例在此不做限定。
S502:针对时间序列集合中的任一第一时间序列片段,将第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值。
其中,关于S502的具体实现可以参见上述S202的相关描述,本实施例在此不再限定。
S503:针对第一时刻对应的多变量参数值,获取第二时间序列片段。
本实施例中,在根据第一时间序列片段预测出第一时刻对应的多变量参数值后,将第一时间序列片段中的最早时刻对应的序列删除、再加上预测出的第一时刻对应的多变量参数值构成第二时间序列片段。其中,第二时间序列片段包括第一时刻对应的多变量参数值,且第二时间序列片段的长度与第一时间序列片段的长度一致。
例如图6所示的不同时间序列片段示意图,第一时间序列片段长度为So,白色框为基于第一时间序列片段预测的第一时刻对应的多变量参数值。将第一时间序列片段中的后So-1个值与第一时刻对应的多变量参数值构成第二时间序列片段。
S504:将第二时间序列片段输入图神经网络,预测第二时刻对应的多变量参数值。
在获取第二时间序列片段后,将该第二时间序列片段输入图神经网络,预测第二时刻对应的多变量参数值。其中,第二时刻为与第一时刻相邻的下一时刻。
具体地,将第二时间序列片段以及第二时刻对应的多变量序列标签输入图神经网络的编码器,获得各变量对应的噪声特征以及第二时刻各变量的预测特征;将第二时刻各变量的预测特征与各变量对应的噪声特征输入图神经网络的解码器,获得第二时刻对应的多变量参数值。其中,关于利用图神经网络预测第二时刻对应的多变量参数值的具体实现可以参见上述S202的相关描述。
例如图6中黑色框为基于第二时间序列片段预测获得的第二时刻对应的多变量参数值。需要说明的是,当增加预测的次数时,将第二时间序列片段中的后So-1个值与第二时刻对应的多变量参数值构成第三时间序列片段,并基于第三时间序列片段预测第三时刻对应的多变量参数值。依次类推,从而可以实现多次预测。
S505:根据多个第二时刻对应的多变量参数值以及第二时刻对应的多变量序列标签确定优化函数。
针对每个第一时间序列片段,在确定出第二时刻对应的多变量参数值后,根据多个第二时刻对应的多变量参数值以及多个第二时刻对应的多变量序列标签确定优化函数。其中,优化函数包括因果矩阵以及利用第二时刻对应的多变量参数值以及第二时刻对应的多变量序列标签确定出的损失函数。
其中,关于利用第二时刻对应的多变量参数值以及第二时刻对应的多变量序列标签确定优化函数的具体实现可以参见上述S203的相关描述。
S506:以最小化函数为目标,确定因果矩阵中各参数的取值。
S507:根据因果矩阵中各参数的取值确定多变量时间序列中多变量之间的因果关系。
其中,关于S506和S507的具体实现可以参见上述S204和S205的相关描述,本实施例在此不再赘述。
基于上述方法实施例,本申请实施例还提供了一种多变量时间序列处理装置,下面将结合附图进行说明。
参见图7,该图为本申请实施例提供的了一种多变量时间序列处理装置结构图,该装置700包括:获取单元701、预测单元702和确定单元703。
获取单元,用于获取时间序列集合,所述时间序列集合中包括多个第一时间序列片段,所述多个第一时间序列片段中每个第一时间序列片段的长度相同,所述第一时间序列片段为多变量时间序列;
预测单元,用于针对所述时间序列集合中的任一第一时间序列片段,将所述第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值,所述第一时刻为与所述第一时间序列片段中最晚时刻相邻的下一时刻;
确定单元,用于根据多个所述第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签确定优化函数,所述优化函数包括所述图神经网络的损失函数和因果矩阵;
所述确定单元,还用于以最小化所述优化函数为目标,确定所述因果矩阵中各参数的取值;
所述确定单元,还用于根据所述因果矩阵中各参数的取值确定所述多变量时间序列中多变量之间的因果关系。
在一种可能的实现方式中,所述确定单元703,具体用于针对任一所述第一时刻对应的多变量参数值,获取第二时间序列片段,所述第二时间序列片段包括所述第一时刻对应的多变量参数值,且所述第二时间序列片段的长度与所述第一时间序列片段的长度一致;将所述第二时间序列片段输入所述图神经网络,预测第二时刻对应的多变量参数值,所述第二时刻为与所述第一时刻相邻的下一时刻;根据多个所述第二时刻对应的多变量参数值以及所述第二时刻对应的多变量序列标签确定优化函数。
在一种可能的实现方式中,所述确定单元703,具体用于当所述因果矩阵中一参数的取值非零时,确定多变量之间存在时滞因果关系。
在一种可能的实现方式中,所述预测单元702,具体用于将所述第一时间序列片段以及第一时刻对应的多变量序列标签输入所述图神经网络的编码器,获得各变量对应的噪声特征以及所述第一时刻各变量的预测特征;将所述第一时刻各变量的预测特征与所述各变量对应的噪声特征输入所述图神经网络的解码器,获得第一时刻对应的多变量参数值。
在一种可能的实现方式中,所述确定单元703,还用于在根据所述因果矩阵中各参数的取值确定所述多变量时间序列中多变量之间的因果关系之前,确定所述因果矩阵中的取值小于预设阈值的目标参数;将所述目标参数的取值置为0。
在一种可能的实现方式中,所述获取单元701,具体用于获取观察窗口和滑动步长;根据所述观察窗口和所述滑动步长在时间序列进行滑动,获得多个第一时间序列片段。
在一种可能的实现方式中,所述观察窗口的长度不小于最大时滞值。
需要说明的是,本实施例中各个单元的具体实现可以参见上述方法实施例中的相关描述。
本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。本申请实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。例如,上述实施例中,处理单元和发送单元可以是同一个单元,也可以是不同的单元。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
参见图8,其示出了适于用来实现本公开实施例的电子设备800的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等的固定终端。图8示出的电子设备仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储装置808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
通常,以下装置可以连接至I/O接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808;以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图8示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从ROM802被安装。在该计算机程序被处理装置801执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施例提供的电子设备与上述实施例提供的方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是一—但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组含。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(Hyper Text TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元/模块的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组含。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组含。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种多变量时间序列处理方法,其特征在于,所述方法包括:
获取时间序列集合,所述时间序列集合中包括多个第一时间序列片段,所述多个第一时间序列片段中每个第一时间序列片段的长度相同,所述第一时间序列片段为多变量时间序列;
针对所述时间序列集合中的任一第一时间序列片段,将所述第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值,所述第一时刻为与所述第一时间序列片段中最晚时刻相邻的下一时刻;
根据多个所述第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签确定优化函数,所述优化函数包括所述图神经网络的损失函数和因果矩阵;
以最小化所述优化函数为目标,确定所述因果矩阵中各参数的取值;
根据所述因果矩阵中各参数的取值确定所述多变量时间序列中多变量之间的因果关系。
2.根据权利要求1所述的方法,其特征在于,所述根据多个所述第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签确定优化函数,包括:
针对任一所述第一时刻对应的多变量参数值,获取第二时间序列片段,所述第二时间序列片段包括所述第一时刻对应的多变量参数值,且所述第二时间序列片段的长度与所述第一时间序列片段的长度一致;
将所述第二时间序列片段输入所述图神经网络,预测第二时刻对应的多变量参数值,所述第二时刻为与所述第一时刻相邻的下一时刻;
根据多个所述第二时刻对应的多变量参数值以及所述第二时刻对应的多变量序列标签确定优化函数。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述因果矩阵中各参数的取值确定所述多变量时间序列中多变量之间的因果关系,包括:
当所述因果矩阵中一参数的取值非零时,确定多变量之间存在时滞因果关系。
4.根据权利要求1所述的方法,其特征在于,所述将所述第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值,包括:
将所述第一时间序列片段以及第一时刻对应的多变量序列标签输入所述图神经网络的编码器,获得各变量对应的噪声特征以及所述第一时刻各变量的预测特征;
将所述第一时刻各变量的预测特征与所述各变量对应的噪声特征输入所述图神经网络的解码器,获得第一时刻对应的多变量参数值。
5.根据权利要求1所述的方法,其特征在于,在根据所述因果矩阵中各参数的取值确定所述多变量时间序列中多变量之间的因果关系之前,还包括:
确定所述因果矩阵中的取值小于预设阈值的目标参数;
将所述目标参数的取值置为0。
6.根据权利要求1所述的方法,其特征在于,所述获取时间序列集合,包括:
获取观察窗口和滑动步长;
根据所述观察窗口和所述滑动步长在时间序列进行滑动,获得多个第一时间序列片段。
7.根据权利要求6所述的方法,其特征在于,所述观察窗口的长度不小于最大时滞值。
8.一种多变量时间序列处理装置,其特征在于,所述装置包括:
获取单元,用于获取时间序列集合,所述时间序列集合中包括多个第一时间序列片段,所述多个第一时间序列片段中每个第一时间序列片段的长度相同,所述第一时间序列片段为多变量时间序列;
预测单元,用于针对所述时间序列集合中的任一第一时间序列片段,将所述第一时间序列片段输入图神经网络,预测第一时刻对应的多变量参数值,所述第一时刻为与所述第一时间序列片段中最晚时刻相邻的下一时刻;
确定单元,用于根据多个所述第一时刻对应的多变量参数值以及多个第一时刻对应的多变量序列标签确定优化函数,所述优化函数包括所述图神经网络的损失函数和因果矩阵;
所述确定单元,还用于以最小化所述优化函数为目标,确定所述因果矩阵中各参数的取值;
所述确定单元,还用于根据所述因果矩阵中各参数的取值确定所述多变量时间序列中多变量之间的因果关系。
9.一种电子设备,其特征在于,所述设备包括:处理器和存储器;
所述存储器,用于存储指令或计算机程序;
所述处理器,用于执行所述存储器中的所述指令或计算机程序,以使得所述电子设备执行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在设备上运行时,使得所述设备执行权利要求1-7任一项所述的方法。
CN202210529330.4A 2022-05-16 2022-05-16 一种多变量时间序列处理方法、装置、设备及介质 Pending CN114925811A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210529330.4A CN114925811A (zh) 2022-05-16 2022-05-16 一种多变量时间序列处理方法、装置、设备及介质
PCT/CN2023/088339 WO2023221701A1 (zh) 2022-05-16 2023-04-14 一种多变量时间序列处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210529330.4A CN114925811A (zh) 2022-05-16 2022-05-16 一种多变量时间序列处理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114925811A true CN114925811A (zh) 2022-08-19

Family

ID=82807959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210529330.4A Pending CN114925811A (zh) 2022-05-16 2022-05-16 一种多变量时间序列处理方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN114925811A (zh)
WO (1) WO2023221701A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821725A (zh) * 2023-03-28 2023-09-29 北京火山引擎科技有限公司 数据处理方法、设备及存储介质
WO2023221701A1 (zh) * 2022-05-16 2023-11-23 北京火山引擎科技有限公司 一种多变量时间序列处理方法、装置、设备及介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110266552B (zh) * 2019-08-15 2020-04-21 华为技术有限公司 流量异常检测的方法、模型训练方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190034497A1 (en) * 2017-07-27 2019-01-31 Nec Laboratories America, Inc. Data2Data: Deep Learning for Time Series Representation and Retrieval
CN112101480B (zh) * 2020-09-27 2022-08-05 西安交通大学 一种多变量聚类与融合的时间序列组合预测方法
CN114169394B (zh) * 2021-11-04 2024-10-01 浙江大学 一种多尺度自适应图学习的多变量时间序列预测方法
CN114372504B (zh) * 2021-12-06 2024-09-10 燕山大学 一种基于图神经网络的风电机组故障预警方法
CN114925811A (zh) * 2022-05-16 2022-08-19 北京火山引擎科技有限公司 一种多变量时间序列处理方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023221701A1 (zh) * 2022-05-16 2023-11-23 北京火山引擎科技有限公司 一种多变量时间序列处理方法、装置、设备及介质
CN116821725A (zh) * 2023-03-28 2023-09-29 北京火山引擎科技有限公司 数据处理方法、设备及存储介质

Also Published As

Publication number Publication date
WO2023221701A1 (zh) 2023-11-23

Similar Documents

Publication Publication Date Title
US11620532B2 (en) Method and apparatus for generating neural network
CN114925811A (zh) 一种多变量时间序列处理方法、装置、设备及介质
CN112364860B (zh) 字符识别模型的训练方法、装置和电子设备
CN110634047B (zh) 一种推荐房源的方法、装置、电子设备及存储介质
CN111783810A (zh) 用于确定用户的属性信息的方法和装置
CN112035753A (zh) 推荐页面生成方法、装置、电子设备和计算机可读介质
CN114049072A (zh) 指标确定方法、装置、电子设备和计算机可读介质
CN112598337A (zh) 针对物品的车辆控制方法、装置、设备和计算机可读介质
CN116483891A (zh) 一种信息预测方法、装置、设备和存储介质
CN111967584A (zh) 生成对抗样本的方法、装置、电子设备及计算机存储介质
CN116340632A (zh) 对象推荐方法、装置、介质及电子设备
CN115808993A (zh) 一种交互方法、装置、电子设备、计算机可读介质
CN115827705A (zh) 用于反事实解释的数据处理方法和装置
CN112860999B (zh) 信息推荐方法、装置、设备和存储介质
CN115269978A (zh) 一种视频标签生成方法、装置、设备及介质
KR20240148369A (ko) 다변수 시간 시퀀스 처리 방법 및 장치, 디바이스 및 매체
CN113592607A (zh) 产品推荐方法、装置、存储介质及电子设备
CN113779103A (zh) 用于检测异常数据的方法和装置
CN112488947A (zh) 模型训练和图像处理方法、装置、设备和计算机可读介质
CN118536021B (zh) 基于多传感器的实时地下水水位动态监测系统
CN111368204A (zh) 内容推送方法、装置、电子设备及计算机可读介质
CN114374738B (zh) 信息推送方法、装置、存储介质及电子设备
CN111860518B (zh) 用于分割图像的方法、装置、设备和计算机可读介质
CN110019398B (zh) 用于输出数据的方法和装置
CN115565607B (zh) 确定蛋白质信息的方法、装置、可读介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination