CN115809747A - 一种基于金字塔式因果网络的耦合信息流长期预测方法 - Google Patents

一种基于金字塔式因果网络的耦合信息流长期预测方法 Download PDF

Info

Publication number
CN115809747A
CN115809747A CN202310065473.9A CN202310065473A CN115809747A CN 115809747 A CN115809747 A CN 115809747A CN 202310065473 A CN202310065473 A CN 202310065473A CN 115809747 A CN115809747 A CN 115809747A
Authority
CN
China
Prior art keywords
time
pyramid
information
network
causal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310065473.9A
Other languages
English (en)
Other versions
CN115809747B (zh
Inventor
李雨芝
邱晨萌
邵其
陈都鑫
虞文武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202310065473.9A priority Critical patent/CN115809747B/zh
Publication of CN115809747A publication Critical patent/CN115809747A/zh
Application granted granted Critical
Publication of CN115809747B publication Critical patent/CN115809747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于金字塔式因果网络的耦合信息流长期预测方法,适用于预测耦合信息流的长时时空信息,该方案采用因果性指标判断,以交通流为例,通过检测器获取的车辆速度时间序列数据为基础构建因果网络,通过互信息估计方法来计算因果熵,完成因果网络的构建。利用金字塔时空网络模型,从输入预处理层到时空块层,得到预测结果。其中每个时空块包含一个可以双向提取时间序列数据的时间金字塔模块和一个可以总结因果网络和地理网络信息的残差多图卷积网络模块。该方法可达到较高的信息流长时预测精度,可为在智能交通系统提供有效数据支撑。

Description

一种基于金字塔式因果网络的耦合信息流长期预测方法
技术领域
本发明涉及一种预测方法,具体涉及一种基于金字塔式因果网络的耦合信息流长期预测方法,属于预测耦合信息流术领域。
背景技术
随着网络信息平台的不断发展,信息流在现代管理、市场营销、舆情监测、交通等领域都有所体现。信息流预测的目标是通过给出网络结构和历史数据,预测未来一段时间内信息流变化的总体趋势。由于近年来信息流数据类型和数量的爆炸性增长,人们对有效稳定的信息流预测方法有着强烈的需求。一般来说,信息流预测模型大致可以分为两类:经典统计方法和数据驱动方法。
当网络系统不复杂,即检测器单元较少时,利用统计方法预测耦合信息流是可行的。历史均值模型(HA)通过最小二乘法进行估计,一定程度内解决不同时间、时段的信息流变化问题;时间序列算法(ARIMA)等传统统计方法利用时间序列观测值之间的依赖关系和相关性,从而进行动态预测。然而,受统计方法处理高维时间序列数据能力的限制和网络规模和数据量的增加,越来越多的研究人员开始关注基于数据驱动的预测方法。由于神经网络算法在处理人类活动、社会关系、空气质量等复杂数据方面的显著优势,深度神经网络为解决耦合信息流预测问题提供了新的思路。目前已有许多神经网络方法用于信息流预测,如深度置信网络(DBN)、堆叠式自编码器(SAE)等,它们能够有效地学习高维数据的特征。最近提出的T-GCN模型是利用图卷积方法提取图信息,结合循环神经网络(RNN)预测信息流,可以获得良好的预测结果。但是,基于数据驱动的交通流预测方法数据仍面临两个困难:(1)由于受卷积神经网络接收域的限制,T-GCN模型不能有效地总结网络的全局信息。网络具有长距离依赖性,基于网络的T-GCN模型不能保证长期交通流预测的稳定性;(2)受RNN方法性能的限制,T-GCN模型在处理长期预测任务时不能有效地聚合数据的长期依赖性,会导致预测结果不准确。因此,这些基于数据驱动的预测方法仍然不能提取网络的全球空间信息,不能把握时间序列数据的长期依赖性。因此,迫切的需要一种新的方案解决上述技术问题。
发明内容
本发明正是针对现有技术中存在的问题,提供一种金字塔时空网络模型(PSTN)来进行耦合信息流的预测,特别是交通流的长期预测。根据上述分析,网络不能很好地提取数据的长距离依赖性。因此,我们引入因果网络来重新构建交通流网络。通过因果网络构建,每个节点的父节点,即影响该节点产生变化的节点,将是该节点的一阶邻居,然后通过图卷积网络(GCN)获得网络空间的因果关系,利用多种提取方法提取时间序列数据的时间特征。本发明可以更有效地获取耦合信息流网络的时空信息,特别是在长期预测方面有较好的效果。
为了实现上述目的,本发明的技术方案如下,一种基于金字塔式因果网络的耦合信息流长期预测方法,所述方法包括以下步骤:
步骤1:因果网络重构;
步骤2:金字塔时空网络模型建立。
其中,步骤1:因果网络重构,包括以下两个步骤
步骤11:构建复杂的因果网络,具体如下:我们采用基于因果性指标的因果推理方法来构建复杂的因果网络,对于事件
Figure SMS_1
,我们可以通过信息熵
Figure SMS_2
来反映信息的不确定性,其公式为:
Figure SMS_3
其中
Figure SMS_4
是变量
Figure SMS_5
的概率,而对于两个事件
Figure SMS_6
可以通过定义联合熵
Figure SMS_7
和条件熵
Figure SMS_8
来确定信息之间的关系,其公式为:
Figure SMS_9
其中
Figure SMS_10
是变量
Figure SMS_11
的联合概率和条件概率,互信息
Figure SMS_12
描述两个事件
Figure SMS_13
之间的共享信息,当
Figure SMS_14
的关系越密切,互信息
Figure SMS_15
越大,其公式为:
Figure SMS_16
此时若有另一事件
Figure SMS_17
作为发生条件时,事件
Figure SMS_18
的条件互信息
Figure SMS_19
Figure SMS_20
条件互信息
Figure SMS_21
反应在条件
Figure SMS_22
下两个事件
Figure SMS_23
的关系,不能描述信息流的方向,而传递熵
Figure SMS_24
解决这一问题,其公式为:
Figure SMS_25
设计了一个因果熵指标,通过确定延迟时间
Figure SMS_26
,可以得到两个时间序列之间信息流的方向,定义为:
Figure SMS_27
这一指标反映在给定的条件
Figure SMS_28
且明确
Figure SMS_29
的信息和方向时,
Figure SMS_30
能提供的信息量。
步骤12:计算因果熵,因果熵等价于互信息,通过一种基于KNN的互信息估计方法来估计两个事件
Figure SMS_31
的互信息:
Figure SMS_32
其中,
Figure SMS_33
表示所有样本的平均值,
Figure SMS_34
表示为近邻点个数,
Figure SMS_35
是一个digamma函数,
Figure SMS_36
表示样本大小,
Figure SMS_37
表示在
Figure SMS_38
方向上满足KNN的点数。
当条件集
Figure SMS_39
为多维随机变量时,将互信息公式推广为
Figure SMS_40
其中,步骤2:金字塔时空网络模型建立,该阶段包括三个步骤:
步骤21:预处理;
步骤22:时空块;
步骤23:解码输出。
其中,步骤21:预处理,具体如下:将时间数据进行预处理并改变数据的维数,分为两个部分:
1、学习每个时间段的权重,从而找到最重要的时间段,并通过赋予更高的权重来强调该
时间段,设输入
Figure SMS_41
,其中
Figure SMS_42
为时间段的个数,衡量时间段权重的公式如下:
Figure SMS_43
其中,
Figure SMS_44
是全局平均池化,将每个时间段的信息汇总成为标量
Figure SMS_45
Figure SMS_46
是可学习的权值;
Figure SMS_47
分别是ReLU函数和sigmoid函数,由此本发明可以生成权值
Figure SMS_48
,这里的权值是强调时间段后得到的,然后
Figure SMS_49
点乘于输入
Figure SMS_50
2、增加维度,由于节点特征维度
Figure SMS_51
为1,与时间段维数不同,因此特征维度需要增加,增加维度的公式如下:
Figure SMS_52
其中
Figure SMS_53
分别对特征维数
Figure SMS_54
和时间段维数
Figure SMS_55
进行线性变换,
Figure SMS_56
是经过处理后的数据。
其中,步骤22:时空块,具体如下:时空块(STBlock)。每个时空块包含一个可以双向提取时间序列数据的时间金字塔模块和一个可以总结因果网络和地理网络信息的残差多图卷积网络模块。
步骤22-1、时间模块,本发明通过金字塔式时间模型提取时间序列信息,具体如下:
步骤22-1.1金字塔时间模型的主体由时间维度上的一维卷积组成,通过一维卷积,以金字塔结构逐步提取输入数据
Figure SMS_57
的时间信息,卷积公式如下:
Figure SMS_58
其中,
Figure SMS_59
为第
Figure SMS_60
个STBlock的
Figure SMS_61
层的输入,
Figure SMS_62
为一维卷积核,随着金字塔层的增加,输入数据
Figure SMS_63
的时间维度将被提取出来;
步骤22-1.2通过金字塔结构提取数据后,每一层都会得到不同长度的的时间序列数据。然后将门控循环神经网络(GRU)分别应用于每个金字塔层,模型如下:
Figure SMS_64
其中
Figure SMS_65
为隐藏层,
Figure SMS_66
为随机参数,由此,金字塔的每一层都会得到经过处理的时间序列数据
Figure SMS_67
步骤22-1.3本发明使用每一层的最后一个时间段
Figure SMS_68
来汇总信息,汇总信息过程如下:
Figure SMS_69
其中
Figure SMS_70
是第
Figure SMS_71
个STBlock的提取结果,
Figure SMS_72
为金字塔层数,提取结果将作为空间模块的输入。
步骤22-2、空间模块;具体如下:
步骤22-2.1由于交通地理网络是非欧几里德网络,通过GNN的谱域方法进行提取,设
Figure SMS_73
为信号,
Figure SMS_74
是图的邻接矩阵,卷积描述为:
Figure SMS_75
其中
Figure SMS_76
为卷积输出,
Figure SMS_77
为滤波器,
Figure SMS_78
为参数,
Figure SMS_79
是归一化Laplacian 矩阵
Figure SMS_80
的特征向量,
Figure SMS_81
是其特征值,用Chebyshev多项式近似滤波器
Figure SMS_82
得到:
Figure SMS_83
其中,
Figure SMS_84
多项式,
Figure SMS_85
为特征值的缩放:
Figure SMS_86
其中,
Figure SMS_87
为矩阵
Figure SMS_88
的最大特征值,由此可以得到
Figure SMS_89
的表达式为:
Figure SMS_90
本发明设定Chebyshev多项式阶为1,并逼近最大特征值为2,由此得到GCN模型为:
Figure SMS_91
其中,
Figure SMS_92
是加权邻接矩阵,
Figure SMS_93
是卷积输出,
步骤22-2.2为了保证STBlock不改变数据维数,空间模块的输出维数将增加,公式如下:
Figure SMS_94
其中,
Figure SMS_95
表示第
Figure SMS_96
个STBlock的输出。
其中,步骤23:解码输出,具体如下,根据一系列线性变换,本发明对提取的信息进行解码,使输出特征维数为1,模型如下:
Figure SMS_97
其中,输出
Figure SMS_98
为模型预测结果。
相对于现有技术,本发明具有如下优点,1)该技术方案本发明利用数据驱动的方法,结合了网络和因果网络,可以通过提取分布式空间特征来捕捉更深层的网络关系;2)本发明对于耦合信息流预测工作有显著的改善,明显优于其他模型;3)本发明在PeMSD7(M)数据集上取得了出色的预测性能,其长期预测精度比其他广泛应用的时空预测模型有较好的提升。
附图说明
图1为本发明整体流程图;
图2为STBlock流程图;
图3 为预处理流程图。
具体实施方式
为了加深对本发明的理解,下面结合附图对本实施例做详细的说明。
实施例1:参见图1-图3,一种基于金字塔式因果网络的耦合信息流长期预测方法,所述方法包括以下步骤:
步骤1:因果网络重构;
步骤2:金字塔时空网络模型建立。
其中,步骤1:因果网络重构,包括以下两个步骤:
步骤11:构建复杂的因果网络,具体如下:我们采用基于因果性指标的因果推理方法来构建复杂的因果网络,对于事件
Figure SMS_99
,我们可以通过信息熵
Figure SMS_100
来反映信息的不确定性,其公式为:
Figure SMS_101
其中
Figure SMS_102
是变量
Figure SMS_103
的概率,而对于两个事件
Figure SMS_104
可以通过定义联合熵
Figure SMS_105
和条件熵
Figure SMS_106
来确定信息之间的关系,其公式为:
Figure SMS_107
其中
Figure SMS_108
是变量
Figure SMS_109
的联合概率和条件概率,互信息
Figure SMS_110
描述两个事件
Figure SMS_111
之间的共享信息,当
Figure SMS_112
的关系越密切,互信息
Figure SMS_113
越大,其公式为:
Figure SMS_114
此时若有另一事件
Figure SMS_115
作为发生条件时,事件
Figure SMS_116
的条件互信息
Figure SMS_117
Figure SMS_118
条件互信息
Figure SMS_119
反应在条件
Figure SMS_120
下两个事件
Figure SMS_121
的关系,不能描述信息流的方向,而传递熵
Figure SMS_122
解决这一问题,其公式为:
Figure SMS_123
设计了一个因果熵指标,通过确定延迟时间
Figure SMS_124
,可以得到两个时间序列之间信息流的方向,定义为:
Figure SMS_125
这一指标反映在给定的条件
Figure SMS_126
且明确
Figure SMS_127
的信息和方向时,
Figure SMS_128
能提供的信息量。
以交通流为例,为了根据探测器获得的车辆速度信息重构网络结构,本发明选择将每个探测器视为一个节点,从而组成一个节点集
Figure SMS_129
,并假设两个节点的因果熵大于0时,连接两个节点的边归入集合
Figure SMS_130
中,矩阵
Figure SMS_131
为以因果熵为权值的矩阵。则其因果网络图为
Figure SMS_132
,可以描述每一个探测器之间的交通流信息传递情况。
任一节点
Figure SMS_133
,所有方向指向它且因果熵大于0的节点被称之为父节点,归于父节点集
Figure SMS_134
,因果性指标假设节点
Figure SMS_135
的父节点形成了使因果熵最大化的最小节点集
Figure SMS_136
因果性指标判断可分为两个部分:因果节点的聚合和非因果节点的移除。
1、聚合算法:由于变量
Figure SMS_138
Figure SMS_141
时刻对其在
Figure SMS_143
时刻的状态有因果影响,该指标可将初始条件集设为
Figure SMS_137
。任一节点
Figure SMS_142
,将节点
Figure SMS_144
的最大因果熵节点记为
Figure SMS_145
,并将它添加到条件
Figure SMS_139
中。重复上述步骤,直到没有节点能使因果熵大于0,这样我们就可以获得条件集
Figure SMS_140
2、移除算法:对于每个节点
Figure SMS_146
,如果因果熵等于0,则从条件集
Figure SMS_147
中删除
Figure SMS_148
,最终得到节点
Figure SMS_149
的父节点集
Figure SMS_150
对每个节点进行因果性指标判断,从而得到两两节点之间的因果熵,从而得到因果网络图
Figure SMS_151
步骤12:计算因果熵,因果熵等价于互信息,因此,我们通过一种基于KNN的互信息估计两个事件
Figure SMS_152
的互信息:
Figure SMS_153
其中,
Figure SMS_154
表示所有样本的平均值,
Figure SMS_155
表示为近邻点个数,
Figure SMS_156
是一个digamma函数,
Figure SMS_157
表示样本大小,
Figure SMS_158
表示在
Figure SMS_159
方向上满足KNN的点数。
当条件集
Figure SMS_160
为多维随机变量时,将互信息公式推广为
Figure SMS_161
其中,步骤2:金字塔时空网络模型建立,该阶段包括三个步骤:
步骤21:预处理;
步骤22:时空块;
步骤23:解码输出。
其中,步骤21:预处理,具体如下:将时间数据进行预处理并改变数据的维数,分为两个部分:
1、学习每个时间段的权重,从而找到最重要的时间段,并通过赋予更高的权重来强调该
时间段,设输入
Figure SMS_162
,其中
Figure SMS_163
为时间段的个数。衡量时间段权重的公式如下:
Figure SMS_164
其中,
Figure SMS_165
是全局平均池化,将每个时间段的信息汇总成为标量
Figure SMS_166
Figure SMS_167
是可学习的权值;
Figure SMS_168
分别是ReLU函数和sigmoid函数,由此本发明可以生成权值
Figure SMS_169
,这里的权值是强调时间段后得到的,然后
Figure SMS_170
点乘于输入
Figure SMS_171
2增加维度,由于节点特征维度
Figure SMS_172
为1,与时间段维数不同,因此特征维度需要增加,增加维度的公式如下:
Figure SMS_173
其中
Figure SMS_174
分别对特征维数
Figure SMS_175
和时间段维数
Figure SMS_176
进行线性变换,
Figure SMS_177
是经过处理后的数据。
其中,步骤22:时空块,具体如下:时空块(STBlock)。每个时空块包含一个可以双向提取时间序列数据的时间金字塔模块和一个可以总结因果网络和地理网络信息的残差多图卷积网络模块。
步骤22-1、时间模块,本发明通过金字塔式时间模型提取时间序列信息,
步骤22-1.1金字塔时间模型的主体由时间维度上的一维卷积组成,通过一维卷积,以金字塔结构逐步提取输入数据
Figure SMS_178
的时间信息,卷积公式如下:
Figure SMS_179
其中,
Figure SMS_180
为第
Figure SMS_181
个STBlock的
Figure SMS_182
层的输入,
Figure SMS_183
为一维卷积核,随着金字塔层的增加,输入数据
Figure SMS_184
的时间维度将被提取出来;
步骤22-1.2通过金字塔结构提取数据后,每一层都会得到不同长度的的时间序列数据。然后将门控循环神经网络(GRU)分别应用于每个金字塔层,模型如下:
Figure SMS_185
其中
Figure SMS_186
为隐藏层,
Figure SMS_187
为随机参数,由此,金字塔的每一层都会得到经过处理的时间序列数据
Figure SMS_188
步骤22-1.3本发明使用每一层的最后一个时间段
Figure SMS_189
来汇总信息,汇总信息过程如下:
Figure SMS_190
其中
Figure SMS_191
是第
Figure SMS_192
个STBlock的提取结果,
Figure SMS_193
为金字塔层数,提取结果将作为空间模块的输入。
步骤22-2、空间模块;具体如下:
步骤22-2.1由于交通地理网络是非欧几里德网络,通过GNN的谱域方法进行提取,设
Figure SMS_194
为信号,
Figure SMS_195
是图的邻接矩阵,卷积描述为:
Figure SMS_196
其中
Figure SMS_197
为卷积输出,
Figure SMS_198
为滤波器,
Figure SMS_199
为参数,
Figure SMS_200
是归一化Laplacian 矩阵
Figure SMS_201
的特征向量,
Figure SMS_202
是其特征值,用Chebyshev多项式近似滤波器
Figure SMS_203
得到:
Figure SMS_204
其中,
Figure SMS_205
多项式,
Figure SMS_206
为特征值的缩放:
Figure SMS_207
其中,
Figure SMS_208
为矩阵
Figure SMS_209
的最大特征值,由此可以得到
Figure SMS_210
的表达式为:
Figure SMS_211
本发明设定Chebyshev多项式阶为1,并逼近最大特征值为2,由此得到GCN模型为:
Figure SMS_212
其中,
Figure SMS_213
是加权邻接矩阵,
Figure SMS_214
是卷积输出,
步骤22-2.2为了保证STBlock不改变数据维数,空间模块的输出维数将增加,公式如下:
Figure SMS_215
其中,
Figure SMS_216
表示第
Figure SMS_217
个STBlock的输出。
其中,步骤23:解码输出,具体如下,根据一系列线性变换,本发明对提取的信息进行解码,使输出特征维数为1,模型如下:
Figure SMS_218
其中,输出
Figure SMS_219
为模型预测结果。
该发明以交通流为例,首先采用因果性指标判断,以检测器获取的车辆速度时间序列数据为基础构建因果网络,通过基于KNN的互信息估计方法来计算因果熵,完成因果网络的构建。接着,该发明利用金字塔时空网络模型,从输入预处理层到时空块层(STBlock),最后得到结果。其中每个时空块包含一个可以双向提取时间序列数据的时间金字塔模块和一个可以总结因果网络和地理网络信息的残差多图卷积网络模块。本发明利用时空数据的邻域信息进行分布式特征提取,保证长期预测的稳定性;所提出的金字塔时空网络模型比其他广泛使用的时空预测模型具有更好的预测效果。
实施例2:一种基于金字塔式因果网络的耦合信息流长期预测方法,所述方法包括以下步骤:
步骤一:以交通流为例,如图1,将节点
Figure SMS_222
设为初始条件集
Figure SMS_223
,其中
Figure SMS_225
为探测器节点集。任一节点
Figure SMS_221
,从而组成一个将节点
Figure SMS_224
的最大因果熵节点记为
Figure SMS_226
,并将它添加到条件
Figure SMS_227
中。重复上述步骤,直到没有节点能使因果熵大于0,这样我们就可以获得条件集
Figure SMS_220
步骤二:对于每个节
Figure SMS_228
点,如果因果熵等于0,则从条件集
Figure SMS_229
中删除
Figure SMS_230
,最终得到节点
Figure SMS_231
的父节点集
Figure SMS_232
步骤三:对每个节点进行上述两步,从而得到两两节点之间的因果熵,从而得到因果网络图
Figure SMS_233
步骤四:通过互信息公式
Figure SMS_234
从而得到因果熵的值,构建出因果网络;
步骤五:如图3,学习每个时间段的权重,从而找到最重要的时间段,并通过赋予更高的权重来强调该时间段。设输入
Figure SMS_235
,公式如下:
Figure SMS_236
步骤六:对特征维数
Figure SMS_237
和时间段维数
Figure SMS_238
进行线性变换,从而增加维度。
Figure SMS_239
是经过处理后的数据;
步骤七:如图2,通过一维卷积,以金字塔结构逐步提取输入数据
Figure SMS_240
的时间信息;
步骤八:将门控循环神经网络(GRU)分别应用于每个金字塔层,从而得到每一层经过处理的时间序列数据
Figure SMS_241
步骤九:使用每一层的最后一个时间段
Figure SMS_242
来汇总信息,从而得到每一个STBlock的提取结果
Figure SMS_243
步骤十:输入
Figure SMS_244
到GCN模型中,通过模型:
Figure SMS_245
其中,
Figure SMS_246
是加权邻接矩阵,得到卷积输出
Figure SMS_247
步骤十:为了保证STBlock不改变数据维数,增加空间模块的输出维数,得到每个STBlock的输出
Figure SMS_248
步骤十一:对提取的信息进行解码,使输出特征维数为1,得到输出
Figure SMS_249
对比了本发明与其他时空预测模型在PeMSD7(M)数据集上30分钟和60分钟的预测效果。为了方便用数据表示,我们定义平均绝对误差
Figure SMS_250
,
Figure SMS_251
其中,
Figure SMS_252
是准确位置,通过该公式我们可以进行对比,数值越小,预测精度越高。具体数据如下:
Figure SMS_253
表1 本发明与其他时空预测模型预测效果对比;
通过表1数据,我们可以发现本发明在PeMSD7(M)数据集上取得了较为出色的预测性能,其长期预测精度比其他时空预测模型更高。
需要说明的是上述实施例,并非用来限定本发明的保护范围,在上述技术方案的基础上所作出的等同变换或替代均落入本发明权利要求所保护的范围。

Claims (10)

1.一种基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,所述方法包括以下步骤:
步骤1:因果网络重构;
步骤2:金字塔时空网络模型建立。
2.根据权利要求1所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤1:因果网络重构,包括两个步骤:
步骤11:构建复杂因果网络;
步骤12:计算因果熵。
3.根据权利要求2所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤11:采用基于因果性指标的因果推理方法来构建复杂的因果网络,对于事件
Figure QLYQS_1
,通过信息熵
Figure QLYQS_2
来反映信息的不确定性,其公式为:
Figure QLYQS_3
其中
Figure QLYQS_4
是变量
Figure QLYQS_5
的概率,而对于两个事件
Figure QLYQS_6
通过定义联合熵
Figure QLYQS_7
和条件熵
Figure QLYQS_8
来确定信息之间的关系,其公式为:
Figure QLYQS_9
其中
Figure QLYQS_10
是变量
Figure QLYQS_11
的联合概率和条件概率,互信息
Figure QLYQS_12
描述两个事件
Figure QLYQS_13
之间的共享信息,当
Figure QLYQS_14
的关系越密切,互信息
Figure QLYQS_15
越大,其公式为:
Figure QLYQS_16
此时若有另一事件
Figure QLYQS_17
作为发生条件时,事件
Figure QLYQS_18
的条件互信息
Figure QLYQS_19
Figure QLYQS_20
条件互信息
Figure QLYQS_21
反应在条件
Figure QLYQS_22
下两个事件
Figure QLYQS_23
的关系,不能描述信息流的方向,而传递熵
Figure QLYQS_24
解决这一问题,其公式为:
Figure QLYQS_25
设计了一个因果熵指标,通过确定延迟时间
Figure QLYQS_26
,得到两个时间序列之间信息流的方向,定义为:
Figure QLYQS_27
这一指标反映在给定的条件
Figure QLYQS_28
且明确
Figure QLYQS_29
的信息和方向时,
Figure QLYQS_30
能提供的信息量。
4.根据权利要求3所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤12:计算因果熵,因果熵等价于互信息,通过一种基于KNN的互信息估计方法来估计两个事件
Figure QLYQS_31
的互信息:
Figure QLYQS_32
其中,
Figure QLYQS_33
表示所有样本的平均值,
Figure QLYQS_34
表示为近邻点个数,
Figure QLYQS_35
是一个digamma函数,
Figure QLYQS_36
表示样本大小,
Figure QLYQS_37
表示在
Figure QLYQS_38
方向上满足KNN的点数,
当条件集
Figure QLYQS_39
为多维随机变量时,将互信息公式推广为
Figure QLYQS_40
5.根据权利要求1所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤2:金字塔时空网络模型建立,包括三个步骤:
步骤21:预处理;
步骤22:时空块;
步骤23:解码输出。
6.根据权利要求5所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤21:预处理,具体如下:将时间数据进行预处理并改变数据的维数,分为两个部分:
(1)学习每个时间段的权重,从而找到最重要的时间段,并通过赋予更高的权重来强调该
时间段,设输入
Figure QLYQS_41
,其中
Figure QLYQS_42
为时间段的个数,衡量时间段权重的公式如下:
Figure QLYQS_43
其中,
Figure QLYQS_44
是全局平均池化,将每个时间段的信息汇总成为标量
Figure QLYQS_45
Figure QLYQS_46
是可学习的权值;
Figure QLYQS_47
分别是ReLU函数和sigmoid函数,由此生成权值
Figure QLYQS_48
,这里的权值是强调时间段后得到的,然后
Figure QLYQS_49
点乘于输入
Figure QLYQS_50
(2)增加维度,由于节点特征维度
Figure QLYQS_51
为1,与时间段维数不同,因此特征维度需要增加,增加维度的公式如下:
Figure QLYQS_52
其中
Figure QLYQS_53
分别对特征维数
Figure QLYQS_54
和时间段维数
Figure QLYQS_55
进行线性变换,
Figure QLYQS_56
是经过处理后的数据。
7.根据权利要求6所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤22:时空块,包括两个模块:
步骤22-1、时间模块;
步骤22-2、空间模块。
8.根据权利要求7所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤22-1、时间模块;通过金字塔式时间模型提取时间序列信息,具体如下:
步骤22-1.1金字塔时间模型的主体由时间维度上的一维卷积组成,通过一维卷积,以金字塔结构逐步提取输入数据
Figure QLYQS_57
的时间信息,卷积公式如下:
Figure QLYQS_58
其中,
Figure QLYQS_59
为第
Figure QLYQS_60
个STBlock的
Figure QLYQS_61
层的输入,
Figure QLYQS_62
为一维卷积核,随着金字塔层的增加,输入数据
Figure QLYQS_63
的时间维度将被提取出来;
步骤22-1.2通过金字塔结构提取数据后,每一层都会得到不同长度的的时间序列数据,然后将门控循环神经网络(GRU)分别应用于每个金字塔层,模型如下:
Figure QLYQS_64
其中
Figure QLYQS_65
为隐藏层,
Figure QLYQS_66
为随机参数,由此,金字塔的每一层都会得到经过处理的时间序列数据
Figure QLYQS_67
步骤22-1.3使用每一层的最后一个时间段
Figure QLYQS_68
来汇总信息,汇总信息过程如下:
Figure QLYQS_69
其中
Figure QLYQS_70
是第
Figure QLYQS_71
个STBlock的提取结果,
Figure QLYQS_72
为金字塔层数,提取结果将作为空间模块的输入。
9.根据权利要求8所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤22-2、空间模块,具体如下:
步骤22-2.1由于交通地理网络是非欧几里德网络,通过GNN的谱域方法进行提取,设
Figure QLYQS_73
为信号,
Figure QLYQS_74
是图的邻接矩阵,卷积描述为:
Figure QLYQS_75
其中
Figure QLYQS_76
为卷积输出,
Figure QLYQS_77
为滤波器,
Figure QLYQS_78
为参数,
Figure QLYQS_79
是归一化Laplacian 矩阵
Figure QLYQS_80
的特征向量,
Figure QLYQS_81
是其特征值,用Chebyshev多项式近似滤波器
Figure QLYQS_82
得到:
Figure QLYQS_83
其中,
Figure QLYQS_84
多项式,
Figure QLYQS_85
为特征值的缩放:
Figure QLYQS_86
其中,
Figure QLYQS_87
为矩阵
Figure QLYQS_88
的最大特征值,由此得到
Figure QLYQS_89
的表达式为:
Figure QLYQS_90
设定Chebyshev多项式阶为1,并逼近最大特征值为2,由此得到GCN模型为:
Figure QLYQS_91
其中,
Figure QLYQS_92
是加权邻接矩阵,
Figure QLYQS_93
是卷积输出,
步骤22-2.2为了保证STBlock不改变数据维数,空间模块的输出维数将增加,公式如下:
Figure QLYQS_94
其中,
Figure QLYQS_95
表示第
Figure QLYQS_96
个STBlock的输出。
10.根据权利要求9所述的基于金字塔式因果网络的耦合信息流长期预测方法,其特征在于,步骤23:解码输出,具体如下,根据一系列线性变换,对提取的信息进行解码,使输出特征维数为1,模型如下:
Figure QLYQS_97
其中,输出
Figure QLYQS_98
为模型预测结果。
CN202310065473.9A 2023-02-06 2023-02-06 一种基于金字塔式因果网络的耦合信息流长期预测方法 Active CN115809747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310065473.9A CN115809747B (zh) 2023-02-06 2023-02-06 一种基于金字塔式因果网络的耦合信息流长期预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310065473.9A CN115809747B (zh) 2023-02-06 2023-02-06 一种基于金字塔式因果网络的耦合信息流长期预测方法

Publications (2)

Publication Number Publication Date
CN115809747A true CN115809747A (zh) 2023-03-17
CN115809747B CN115809747B (zh) 2023-05-09

Family

ID=85487533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310065473.9A Active CN115809747B (zh) 2023-02-06 2023-02-06 一种基于金字塔式因果网络的耦合信息流长期预测方法

Country Status (1)

Country Link
CN (1) CN115809747B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117851920A (zh) * 2024-03-07 2024-04-09 国网山东省电力公司信息通信公司 电力物联数据异常检测方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289034A (zh) * 2020-12-29 2021-01-29 四川高路交通信息工程有限公司 基于多模态时空数据的深度神经网络鲁棒交通预测方法
CN112348222A (zh) * 2020-05-08 2021-02-09 东南大学 一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法
CN112801404A (zh) * 2021-02-14 2021-05-14 北京工业大学 一种基于自适应空间自注意力图卷积的交通预测方法
CN113268916A (zh) * 2021-04-07 2021-08-17 浙江工业大学 一种基于时空图卷积网络的交通事故预测方法
CN114330671A (zh) * 2022-01-06 2022-04-12 重庆大学 一种基于Transformer时空图卷积网络的交通流预测方法
CN114626607A (zh) * 2022-03-16 2022-06-14 福建工程学院 一种基于时空图小波卷积神经网络的交通流预测方法
CN115240418A (zh) * 2022-07-20 2022-10-25 浙江科技学院 基于因果门控-低通图卷积网络的短时交通流量预测方法
CN115240425A (zh) * 2022-07-26 2022-10-25 西北师范大学 一种基于多尺度时空融合图网络的交通预测方法
CN115660135A (zh) * 2022-09-02 2023-01-31 天津大学 基于贝叶斯方法和图卷积的交通流预测方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348222A (zh) * 2020-05-08 2021-02-09 东南大学 一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法
CN112289034A (zh) * 2020-12-29 2021-01-29 四川高路交通信息工程有限公司 基于多模态时空数据的深度神经网络鲁棒交通预测方法
CN112801404A (zh) * 2021-02-14 2021-05-14 北京工业大学 一种基于自适应空间自注意力图卷积的交通预测方法
CN113268916A (zh) * 2021-04-07 2021-08-17 浙江工业大学 一种基于时空图卷积网络的交通事故预测方法
CN114330671A (zh) * 2022-01-06 2022-04-12 重庆大学 一种基于Transformer时空图卷积网络的交通流预测方法
CN114626607A (zh) * 2022-03-16 2022-06-14 福建工程学院 一种基于时空图小波卷积神经网络的交通流预测方法
CN115240418A (zh) * 2022-07-20 2022-10-25 浙江科技学院 基于因果门控-低通图卷积网络的短时交通流量预测方法
CN115240425A (zh) * 2022-07-26 2022-10-25 西北师范大学 一种基于多尺度时空融合图网络的交通预测方法
CN115660135A (zh) * 2022-09-02 2023-01-31 天津大学 基于贝叶斯方法和图卷积的交通流预测方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117851920A (zh) * 2024-03-07 2024-04-09 国网山东省电力公司信息通信公司 电力物联数据异常检测方法及系统

Also Published As

Publication number Publication date
CN115809747B (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN111507521B (zh) 台区电力负荷预测方法及预测装置
CN110427654B (zh) 一种基于敏感状态的滑坡预测模型构建方法及系统
CN111027686B (zh) 一种滑坡位移的预测方法、装置及设备
Chen et al. Short-term wind speed forecasting with principle-subordinate predictor based on Conv-LSTM and improved BPNN
Bo et al. Wind speed forecasting system based on the variational mode decomposition strategy and immune selection multi-objective dragonfly optimization algorithm
CN107992976B (zh) 热点话题早期发展趋势预测系统及预测方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN114299723B (zh) 一种交通流量预测方法
CN115240425A (zh) 一种基于多尺度时空融合图网络的交通预测方法
CN112364975A (zh) 基于图神经网络的终端运行状态预测方法及系统
CN113570859B (zh) 一种基于异步时空膨胀图卷积网络的交通流量预测方法
CN109583588B (zh) 一种短期风速预测方法及系统
Xu et al. Graph partitioning and graph neural network based hierarchical graph matching for graph similarity computation
CN117117859B (zh) 基于神经网络的光伏发电功率预测方法及系统
CN114548592A (zh) 一种基于cemd和lstm的非平稳时间序列数据预测方法
CN115809747A (zh) 一种基于金字塔式因果网络的耦合信息流长期预测方法
CN114169645A (zh) 一种智能电网短期负荷预测方法
CN115862319A (zh) 一种面向时空图自编码器的交通流量预测方法
CN111277646B (zh) 群智感知中基于关联关系和地理位置预测的任务分发方法
CN115510975A (zh) 基于并行Transofmer-GRU的多变量时序异常检测方法及系统
CN115630101A (zh) 水文参数智能化监控与水资源大数据管理系统
CN117494898A (zh) 一种结合注意力机制的时间序列预测方法
CN117175588A (zh) 基于时空相关性的用电负荷预测方法及装置
CN111832623A (zh) 一种基于相空间重构的回声状态网络时间序列预测算法
CN116578858A (zh) 基于图神经网络的空压机故障预测与健康度评价方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant