CN112348222A - 一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法 - Google Patents

一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法 Download PDF

Info

Publication number
CN112348222A
CN112348222A CN202010383790.1A CN202010383790A CN112348222A CN 112348222 A CN112348222 A CN 112348222A CN 202010383790 A CN202010383790 A CN 202010383790A CN 112348222 A CN112348222 A CN 112348222A
Authority
CN
China
Prior art keywords
node
information
network
graph
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010383790.1A
Other languages
English (en)
Inventor
虞文武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202010383790.1A priority Critical patent/CN112348222A/zh
Publication of CN112348222A publication Critical patent/CN112348222A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,包括以下步骤:基于节点时间序列数据利用转移熵建立因果逻辑网络、对逻辑网络节点数据利用图卷积网络(GCN)进行特征提取、在图信息特征h的基础上利用利用门控循环单元GRU进行流量预测,利用反向传播算法进行训练优化参数。本发明通过增加因果网络的逻辑信息,结合图卷积网络和门控循环单元,提高了信息流预测精度。

Description

一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流 预测方法
技术领域
本发明涉及一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,属于信息流预测技术领域。
背景技术
现代化管理服务已经进入了以数据资源和信息技术为双轮驱动的新时期,大数据为信息管理和服务提供了更广阔的视野和更有效的途经。依托多源大数据资源形成的“数据智慧”,亟须构建以大数据体系为统领、科技创新为驱动的发展模式,满足现代化信息管理服务需求。首先,需完善网络化、标准化的数据状态感知采集体系,进一步整合数据资源;其次,需创新大数据分析应用,支撑应用场景高效运营管理、智能化服务;最后,需强化顶层设计、融合发展,构建智能信息大数据生态体系。
流量预测是大数据领域的一个十分重要的研究课题,在交通、金融、气候等领域有着重要的实际应用价值。随着近几年机器学习热潮的到来,机器学习方法中深度利用学习方法进行流量预测得到了广泛关注。2014年,Lv Yisheng et al.将深度学习框架引入流量预测领域,提出了基于Stack Autoencoder的深度学习方法,并取得较为不错的预测结果。后续深度学习方法逐渐引起了人们的关注。2017年,J.Tang et al.提出了一种改进的模糊神经网络方法,成功实现了对时序信息流的多步预测。然而此时的信息流量预测仍然存在着很多问题,其中最重要的是预测准确率不够高,并且预测步数不够长,还不能够实现较为准确的中长期的预测。
2018年,LSTM(Long Short-Term Memory)的兴起,同时也带动了时序信息流预测技术的发展,LSTM是循环神经网络(Recurrent Neural Network,RNN)的一种。2017年,LiY.et al.引入了RNN,其团队提出了一种混合卷积RNN的方法,解决了原先的深度学习框架不能实现较为准确的多步预测的难题,并一定程度上克服了多区域数据关联性耦合的问题,提高了预测准确率。但同时也带来了新的问题,其中就是中长期预测中,由于RNN层数逐渐加深,模型更加复杂,在优化过程中出现了梯度消失问题,而LSTM则很好的解决了这个问题。Mackenzie J.et al.于2018年在LSTM的基础上,增加了层级临时记忆机制(Hierarchical Temporal Memory,HTM),很好的延长了RNN模型在神经网络层数加深时带来的优化难题,更好的延长了时序信息流的预测步数。至此,主流的信息流流量预测模型已经基本建立在各种RNN模型及其变种的基础上。
近两年,又由于图卷积网络(Graph Convolutional Network,GCN)的兴起,图结构信息流预测在效果上有了质的飞跃。图卷积网络是图神经网络的一个重要的分类,图卷积网络借鉴了卷积神经网络中卷积的思想,利用卷积来处理图结构数据的信息,得到了很好的信息特征。由于图结构的数据与图像等数据结构不同,是一种非欧几里得的数据结构,每个节点的邻居数量不同,不能直接利用卷积网络进行特征提取。2014年Joan Bruna等人利用图的拉普拉斯矩阵提出了基于图拉普拉斯矩阵的第一代图卷积网络。其结构为:Ht+1=σ(UgθUTHt),其中U是拉普拉斯矩阵的特征向量,H为隐藏层,g是需要训练的参数,此后Defferrard等人对训练参数利用切比雪夫多项式进行改良得到了第二代图卷积,2017年Kipf.等人将切比雪夫多项式参数化简得到了第三代的图卷积,极大简化了计算量其形式为:
Figure BDA0002483171990000021
其中A是改进的邻接矩阵,D是改进的度矩阵。在第二代图卷积网络中通过对切比雪夫多项式的K值选取,在图数据中反应的是选取某个节点的K阶邻居来进行信息融合。空间域图卷积网络利用某个节点周围的邻居的信息来更新节点的信息。通过对邻居节点的筛选的补0,将节点的邻居个数统一之后采取卷积来提取图数据的信息。
发明内容
本发明的目的是针对现有的技术存在的上述问题,提供一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,本发明所要解决的技术问题是通过计算成对节点之间的转移熵建立一种描述其依赖性的因果逻辑网络,替代单一实体交通网络作为耦合时序信息流预测的输入,从而在因果逻辑网络基础上利用图卷积网络(GCN)来提取图数据的特征,再将提取的特征利用门控循环单元(GRU)进行预测。
为达到上述目的,本发明采用如下的技术方案:一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,所述方法包括以下步骤:
S1,基于N个采样节点的时间序列数据利用转移熵(Transferentropy)建立因果逻辑网络G=(V,E);
转移熵为信息论中两个随机事件X与Y间依赖性的一种度量,表达式为:
Figure BDA0002483171990000022
其中熵HX=-∑xp(x)log2p(x)度量了离散随机变量X在概率分布p(x)下的不确定性,
Figure BDA0002483171990000023
为已知过程X的k阶时滞子序列
Figure BDA0002483171990000024
时的条件熵,
Figure BDA0002483171990000025
Figure BDA0002483171990000026
为已知过程X的k阶时滞子序列和过程Y的l阶时滞子序列
Figure BDA0002483171990000027
时的条件熵。若TEY→X>0,则Y到X之间存在信息流。
因果逻辑网络定义为G=(V,E),其中V={1,2,…,N}为节点集,E=(e_ij)为连边集,i与j连边的权重eij代表i到j的信息流量,本方法中用转移熵值作为连边权重。
S1.1,为了计算转移熵,需要首先确定参数k和l,再估计随机变量的概率分布函数。本方法使用符号编码方法,将节点的时间序列划分为完备事件组。确定状态数q后,将时间序列数值利用
Figure BDA0002483171990000031
分位数划分为q个状态,状态集合为s={s1,s2,…,sq}。因此,节点i的状态可以按下式进行区分,并且将每种状态的频率近似作为概率分布用以计算转移熵
Figure BDA0002483171990000032
S1.2,遍历成对节点i,j之间的转移熵TEi→j,得到初始的有向加权网络。
S1.3,由于转移熵计算存在冗余信息,所以本发明设置阈值θ从而过滤冗余信息。交通节点i流向节点j的信息流连边权重wij
Figure BDA0002483171990000033
S2,基于因果逻辑网络G对逻辑网络节点数据利用图卷积网络(GCN)进行特征提取。逻辑因果网络为G=(V,E),因果网络节点个数为N,初始因果逻辑网络节点特征为X∈RN *C,C为单个节点特征维数,特征提取结果为H∈RN*F,F为特征提取后的节点特征维度。
S2.1,为提取节点特征,图卷积神经网络将集合图结构信息对每个节点进行信息提取,在不考虑边权情况下,传统图神经网络节点特征将按如下形式更新:
Figure BDA0002483171990000034
此处,H(l)表示网络中的第l层,σ是非线性函数,其形式为:
Figure BDA0002483171990000035
θ(l)是该层的权重矩阵。如通常所定义,D和A分别代表度矩阵和邻接矩阵。
Figure BDA0002483171990000036
是一种重新规范化的技巧,我们对图的每个节点添加了自连接,并构建了相应的度数和邻接矩阵,其形式分别为:
Figure BDA0002483171990000037
IN是单位矩阵。输入H(l)即为因果逻辑网络的原始节点特征X,其维数为RN*C,其中N是节点数,C是输入要素数。我们将多层图卷积神经网络链接起来,以生成RN*F维的输出,其中F是输出节点特征向量的维数。
S2.2,对每个节点单独考虑,通过度矩阵与邻接矩阵的实际含义不难得出在图卷积神经网络中每个节点的信息是按照如下规则进行传递的:
Figure BDA0002483171990000041
其中
Figure BDA0002483171990000042
代表节点i在第l+1层的输出,N(i)是节点i的邻居节点的集合,cij是第i个节点与第j个节点度的平方根之积。从上式可以看出每个节点的更新都依赖其邻居节点的信息,特征按照会和邻居特征的形式更新。由于步骤S1中构建的因果逻辑矩阵中存在边权,故对上式结合边权进行改进得到最终的信息提取公式:
Figure BDA0002483171990000043
S3,基于提取的图信息特征hi进行流量预测,在步骤S2中通过结合边权的改进图卷积神经网络对因果逻辑网络的图结构特征进行了提取,从而提取后的节点特征hi中既包含了第i个节点自身特征又包含了i节点的图结构特征,因此本过程将对每个节点独立考虑,利用图信息特征h进行流量预测。
S3.1,对于n个采样节点的时间序列数据
Figure BDA0002483171990000044
针对其每个采样点t,利用S2中提取公式:
Figure BDA0002483171990000045
可以得到t时刻时间截面数据特征ht,在当前时间截面下第i个节点的特征为
Figure BDA0002483171990000046
对第i个节点的所有时间采样节点处理后可得到第i个节点的特征数据
Figure BDA0002483171990000047
S3.2,针对第i个节点的特征数据
Figure BDA0002483171990000048
利用门控循环单元GRU对数据流进行预测。GRU模块的结构为:
zt=σ(Wz[mt-1,ht])
rt=σ(Wr[mt-1,ht])
Figure BDA0002483171990000049
Figure BDA00024831719900000410
其中输入为ht输出为mt。需要训练的参数为:Wz,Wr,W。rt是重置门,控制在t步重置的信息的比例,zt是更新门,确定接受新的信息的比例,最后由mt完成信息的综合。可以见得GRU模块的传递过程可以如下表示:
mt=GRU(mt-1,ht)
从而将n个GRU模块按顺序排列即可接收第i个节点数据特征流
Figure BDA0002483171990000051
上述步骤完成了数据流的编码过程,得到信息流的编码结果
Figure BDA0002483171990000052
S3.3,记编码结果
Figure BDA0002483171990000053
利用编码结果R构造解码器,进行解码预测输出。解码器结构依旧为GRU模块,其传递过程为:
vt+k=GRU(vt+k-1,ht+k-1)
Figure BDA0002483171990000054
Figure BDA0002483171990000055
其中vt+k为解码器在t+k时刻预测输出,
Figure BDA0002483171990000056
为根据vt+k求得的t+k时刻的流量预测数据。
解码器初始输入vt=R,
Figure BDA0002483171990000057
S4,利用反向传播算法进行训练优化参数。对于n个采样节点的时间序列数据设立时间窗t,将0-t时刻的数据用于编码,t-T时刻的数据用于解码,从而有真实训练标签xt+1,xt+2,…,x2t,定义损失函数:
Figure BDA0002483171990000058
利用反向传播算法来逐步减小损失函数,实现参数的训练更新,最终得到信息流数据预测模型。
与现有技术相比,本发明具有以下优点:
1、基于转移熵的耦合信息流测度具有方向性,且能够捕获时间序列的非线性特征,以此建立的因果逻辑网络能够对耦合时序信息流在预测方面表现出的不同时空特征进行很好的测度。
2、图卷积神经网络是一种新型的处理图数据的方法,可以通过邻接矩阵,拉普拉斯矩阵有效的提取图网络信息。
3、门控循环单元GRU是LSTM结构的变体,在处理时序数据中有着广泛的应用,本技术将因果逻辑网络、图卷积网络GCN与门控循环单元GRU相结合,在GCN处理逻辑网络信息额基础上在利用GRU进行时序数据处理,模型具有更好的精度。
4、本方案通过因果逻辑网络进行根源推理提取节点间的因果关系,通过带权改进的图卷积神经网络来提取空间信息,之后通过GRU提取时间信息。全面多层次的运用了空间时间的数据特征,将复杂的流量数据的各个方面进行分析提取,比传统的只考虑空间状态或时间序列信息的预测方法有了明显的进步,也取得了更好的预测结果。
附图说明
图1是本方法中各个部分的结构示意图。
图2是本方法中基于转移熵的因果逻辑网络建立流程图。
图3是本方法的图卷积网络(GCN)示意图。
图4是本方法门控循环单元(GRU)单元结构图。
图5是本方法中门控循环单元(GRU)模型图(h为GRU单元)。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1:参见图1—图5,一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,所述方法包括以下步骤:
S1,基于N个采样节点的时间序列数据利用转移熵(Transferentropy)建立因果逻辑网络G=(V,E);
转移熵为信息论中两个随机事件X与Y间依赖性的一种度量,表达式为:
Figure BDA0002483171990000061
其中熵HX=-∑xp(x)log2p(x)度量了离散随机变量X在概率分布p(x)下的不确定性,
Figure BDA0002483171990000062
为已知过程X的k阶时滞子序列
Figure BDA0002483171990000063
时的条件熵,
Figure BDA0002483171990000064
Figure BDA0002483171990000065
为已知过程X的k阶时滞子序列和过程Y的l阶时滞子序列
Figure BDA0002483171990000066
时的条件熵。若TEY→X>0,则Y到X之间存在信息流。
因果逻辑网络定义为G=(V,E),其中V={1,2,…,N}为节点集,E=(eij)为连边集,i与j连边的权重eij代表i到j的信息流量,本方法中用转移熵值作为连边权重。
S1.1,为了计算转移熵,需要首先确定参数k和l,再估计随机变量的概率分布函数。本方法使用符号编码方法,将节点的时间序列划分为完备事件组。确定状态数q后,将时间序列数值利用
Figure BDA0002483171990000067
分位数划分为q个状态,状态集合为s={s1,s2,…,sq}。因此,节点i的状态可以按下式进行区分,并且将每种状态的频率近似作为概率分布用以计算转移熵
Figure BDA0002483171990000071
S1.2,遍历成对节点i,j之间的转移熵TEi→j,得到初始的有向加权网络。
S1.3,由于转移熵计算存在冗余信息,所以本发明设置阈值θ从而过滤冗余信息。交通节点i流向节点j的信息流连边权重wij
Figure BDA0002483171990000072
S2,基于因果逻辑网络G对逻辑网络节点数据利用图卷积网络(GCN)进行特征提取。逻辑因果网络为G=(V,E),因果网络节点个数为N,初始因果逻辑网络节点特征为X∈RN *C,C为单个节点特征维数,特征提取结果为H∈RN*F,F为特征提取后的节点特征维度。
S2.1,为提取节点特征,图卷积神经网络将集合图结构信息对每个节点进行信息提取,在不考虑边权情况下,传统图神经网络节点特征将按如下形式更新:
Figure BDA0002483171990000073
此处,H(l)表示网络中的第l层,σ是非线性函数,其形式为:
Figure BDA0002483171990000074
θ(l)是该层的权重矩阵。如通常所定义,D和A分别代表度矩阵和邻接矩阵。
Figure BDA0002483171990000075
是一种重新规范化的技巧,我们对图的每个节点添加了自连接,并构建了相应的度数和邻接矩阵,其形式分别为:
Figure BDA0002483171990000076
IN是单位矩阵。输入H(l)即为因果逻辑网络的原始节点特征X,其维数为RN*C,其中N是节点数,C是输入要素数。我们将多层图卷积神经网络链接起来,以生成RN*F维的输出,其中F是输出节点特征向量的维数。
S2.2,对每个节点单独考虑,通过度矩阵与邻接矩阵的实际含义不难得出在图卷积神经网络中每个节点的信息是按照如下规则进行传递的:
Figure BDA0002483171990000077
其中
Figure BDA0002483171990000078
代表节点i在第l+1层的输出,N(i)是节点i的邻居节点的集合,cij是第i个节点与第j个节点度的平方根之积。从上式可以看出每个节点的更新都依赖其邻居节点的信息,特征按照会和邻居特征的形式更新。由于步骤S1中构建的因果逻辑矩阵中存在边权,故对上式结合边权进行改进得到最终的信息提取公式:
Figure BDA0002483171990000081
S3,基于提取的图信息特征hi进行流量预测,在步骤S2中通过结合边权的改进图卷积神经网络对因果逻辑网络的图结构特征进行了提取,从而提取后的节点特征hi中既包含了第i个节点自身特征又包含了i节点的图结构特征,因此本过程将对每个节点独立考虑,利用图信息特征h进行流量预测。
S3.1,对于n个采样节点的时间序列数据
Figure BDA0002483171990000082
针对其每个采样点t,利用S2中提取公式:
Figure BDA0002483171990000083
可以得到t时刻时间截面数据特征ht,在当前时间截面下第i个节点的特征为
Figure BDA0002483171990000084
对第i个节点的所有时间采样节点处理后可得到第i个节点的特征数据
Figure BDA0002483171990000085
S3.2,针对第i个节点的特征数据
Figure BDA0002483171990000086
利用门控循环单元GRU对数据流进行预测。GRU模块的结构为:
zt=σ(Wz[mt-1,ht])
rt=σ(Wr[mt-1,ht])
Figure BDA0002483171990000087
Figure BDA0002483171990000088
其中输入为ht输出为mt。需要训练的参数为:Wz,Wr,W。rt是重置门,控制在t步重置的信息的比例,zt是更新门,确定接受新的信息的比例,最后由mt完成信息的综合。可以见得GRU模块的传递过程可以如下表示:
mt=GRU(mt-1,ht)
从而将n个GRU模块按顺序排列即可接收第i个节点数据特征流
Figure BDA0002483171990000089
上述步骤完成了数据流的编码过程,得到信息流的编码结果
Figure BDA00024831719900000810
S3.3,记编码结果
Figure BDA0002483171990000091
利用编码结果R构造解码器,进行解码预测输出。解码器结构依旧为GRU模块,其传递过程为:
vt+k=GRU(vt+k-1,ht+k-1)
Figure BDA0002483171990000092
Figure BDA0002483171990000093
其中vt+k为解码器在t+k时刻预测输出,
Figure BDA0002483171990000094
为根据vt+k求得的t+k时刻的流量预测数据。解码器初始输入vt=R,
Figure BDA0002483171990000095
S4,利用反向传播算法进行训练优化参数。对于n个采样节点的时间序列数据设立时间窗t,将0-t时刻的数据用于编码,t-T时刻的数据用于解码,从而有真实训练标签xt+1,xt+2,…,x2t,定义损失函数:
Figure BDA0002483171990000096
利用反向传播算法来逐步减小损失函数,实现参数的训练更新,最终得到信息流数据预测模型。
具体来说,基于转移熵(TE)因果网络—图卷积网络(GCN)—门控循环单元(GRU)的预测模型,包括下述步骤:
1.数据处理:
采用深圳某地区2019年6月1日至2019年12月31日的交通流量数据,采样的道路点为154,即节点数为154。统计每个节点的过车量,时间分辨率为5min,即对每五分钟每个采样点统计流量。将流量数据集按照8:2的比例划分训练集和测试集,流量预测的时间窗为1小时,即以用1小时的流量数据预测1小时的流量情况。
2.建模过程:
如图2所示,采样数据处理后得到时间序列数据,在符号编码方法中将交通流区间利用20%、40%、60%、80%分位数划分为5个状态,将每种状态的频率近似作为概率分布,设置参数k=l=1遍历计算两两节点的转移熵后对初始网络进行阈值筛选,只有边权大于阈值的连边被保留下来,形成最终的有向加权因果逻辑网络。
如图3所示,将得到的加权因果逻辑网络放入图卷积神经网络中,对于每个时间点使用共享参数的图神经网络进行训练得到各个节点的时序提取信息数据。
如图5所示,将经过信息提取的时序数据作为输入,输入至GRU模块中,通过GRU模块的编码解码过程实现流量的预测,将流量预测的结果作为下步流量预测的输入多次迭代实现多步预测,GRU单元涉及的算法如图4所示,主要包括更新门与重置门,通过更新门确定接收信息的比例,通过重置门确定重置信息的比例,模块结构如下:
zt=σ(Wz[mt-1,ht])
rt=σ(Wr[mt-1,ht])
Figure BDA0002483171990000101
Figure BDA0002483171990000102
最后将真实数据和输出结果模型置入损失函数L计算,与阈值0.05进行对比,获得模型参数的最优解。
上述为本发明较佳的实施方式,但本发明的实施方式并不受上述内容的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,其特征在于,包括下述步骤:
S1,基于N个采样节点的时间序列数据利用转移熵(Transferentropy)建立因果逻辑网络G=(V,E);
转移熵为信息论中两个随机事件X与Y间依赖性的一种度量,表达式为:
Figure FDA0002483171980000011
其中熵HX=-∑xp(x)log2p(x)度量了离散随机变量X在概率分布p(x)下的不确定性,
Figure FDA0002483171980000012
为已知过程X的k阶时滞子序列
Figure FDA0002483171980000013
时的条件熵,
Figure FDA0002483171980000014
Figure FDA0002483171980000015
为已知过程X的k阶时滞子序列和过程Y的l阶时滞子序列
Figure FDA0002483171980000016
时的条件熵;若TEY→X>0,则Y到X之间存在信息流;
因果逻辑网络定义为G=(V,E),其中V={1,2,…,N}为节点集,E=(e_ij)为连边集,i与j连边的权重eij代表i到j的信息流量,
S2,基于因果逻辑网络G对逻辑网络节点数据利用图卷积网络(GCN)进行特征提取,逻辑因果网络为G=(V,E),因果网络节点个数为N,初始因果逻辑网络节点特征为X∈RN*C,C为单个节点特征维数,特征提取结果为H∈RN*F,F为特征提取后的节点特征维度;
S3,基于提取的图信息特征hi进行流量预测,在步骤S2中通过结合边权的改进图卷积神经网络对因果逻辑网络的图结构特征进行了提取,从而提取后的节点特征hi中既包含了第i个节点自身特征又包含了i节点的图结构特征,因此本过程将对每个节点独立考虑,利用图信息特征h进行流量预测;
S4,利用反向传播算法进行训练优化参数。
2.根据权利要求1所述的基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,其特征在于,所述步骤1具体如下:S1.1,为了计算转移熵,需要首先确定参数k和l,再估计随机变量的概率分布函数,本方法使用符号编码方法,将节点的时间序列划分为完备事件组,确定状态数q后,将时间序列数值利用
Figure FDA0002483171980000017
分位数划分为q个状态,状态集合为s={s1,s2,…,sq},因此,节点i的状态按下式进行区分,并且将每种状态的频率近似作为概率分布用以计算转移熵
Figure FDA0002483171980000021
S1.2,遍历成对节点i,j之间的转移熵TEi→i,得到初始的有向加权网络;
S1.3,由于转移熵计算存在冗余信息,所以本发明设置阈值θ从而过滤冗余信息,交通节点i流向节点j的信息流连边权重wij
Figure FDA0002483171980000022
3.根据权利要求1所述的基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,其特征在于,所述步骤2具体如下:S2.1,为提取节点特征,图卷积神经网络将集合图结构信息对每个节点进行信息提取,在不考虑边权情况下,传统图神经网络节点特征将按如下形式更新:
Figure FDA0002483171980000023
此处,H(l)表示网络中的第l层,σ是非线性函数,其形式为:
Figure FDA0002483171980000024
θ(l)是该层的权重矩阵;如通常所定义,D和A分别代表度矩阵和邻接矩阵,
Figure FDA0002483171980000025
是一种重新规范化的技巧,对图的每个节点添加了自连接,并构建了相应的度数和邻接矩阵,其形式分别为:
Figure FDA0002483171980000026
Figure FDA0002483171980000027
是单位矩阵;输入H(l)即为因果逻辑网络的原始节点特征X,其维数为RN *C,其中N是节点数,C是输入要素数,将多层图卷积神经网络链接起来,以生成RN*F维的输出,其中F是输出节点特征向量的维数;
S2.2,对每个节点单独考虑,通过度矩阵与邻接矩阵的实际含义不难得出在图卷积神经网络中每个节点的信息是按照如下规则进行传递的:
Figure FDA0002483171980000028
其中
Figure FDA0002483171980000031
代表节点i在第l+1层的输出,N(i)是节点i的邻居节点的集合,cij是第i个节点与第j个节点度的平方根之积,从上式可以看出每个节点的更新都依赖其邻居节点的信息,特征按照会和邻居特征的形式更新,由于步骤S1中构建的因果逻辑矩阵中存在边权,故对上式结合边权进行改进得到最终的信息提取公式:
Figure FDA0002483171980000032
4.根据权利要求1所述的基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,其特征在于,所述步骤3具体如下:
S3.1,对于n个采样节点的时间序列数据
Figure RE-FDA0002714538720000032
针对其每个采样点t,利用S2中提取公式:
Figure RE-FDA0002714538720000033
可以得到t时刻时间截面数据特征ht,在当前时间截面下第i个节点的特征为
Figure RE-FDA0002714538720000034
对第i个节点的所有时间采样节点处理后可得到第i个节点的特征数据
Figure RE-FDA0002714538720000035
S3.2,针对第i个节点的特征数据
Figure RE-FDA0002714538720000036
利用门控循环单元GRU对数据流进行预测,GRU模块的结构为:
zt=σ(Wz[mt-1,ht])
rt=σ(Wr[mt-1,ht])
Figure RE-FDA0002714538720000037
Figure RE-FDA0002714538720000038
其中输入为ht输出为mt,需要训练的参数为:Wz,Wr,W;rt是重置门,控制在t步重置的信息的比例,zt是更新门,确定接受新的信息的比例,最后由mt完成信息的综合,可以见得GRU模块的传递过程可以如下表示:
mt=GRU(mt-1,ht)
从而将n个GRU模块按顺序排列即可接收第i个节点数据特征流
Figure RE-FDA0002714538720000039
上述步骤完成了数据流的编码过程,得到信息流的编码结果
Figure RE-FDA00027145387200000310
S3.3,记编码结果
Figure RE-FDA0002714538720000041
利用编码结果R构造解码器,进行解码预测输出;解码器结构依旧为GRU模块,其传递过程为:
vt+k=GRU(vt+k-1,ht+k-1)
Figure RE-FDA0002714538720000042
Figure RE-FDA0002714538720000043
其中vt+k为解码器在t+k时刻预测输出,
Figure RE-FDA0002714538720000044
为根据vt+k求得的t+k时刻的流量预测数据;解码器初始输入vt=R,
Figure RE-FDA0002714538720000045
5.根据权利要求1所述的基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法,其特征在于,所述步骤4具体如下:S4利用反向传播算法进行训练优化参数,对于n个采样节点的时间序列数据设立时间窗t,将0-t时刻的数据用于编码,t-T时刻的数据用于解码,从而有真实训练标签xt+1,xt+2,…,x2t,定义损失函数:
Figure FDA0002483171980000045
利用反向传播算法来逐步减小损失函数,实现参数的训练更新,最终得到信息流数据预测模型。
CN202010383790.1A 2020-05-08 2020-05-08 一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法 Pending CN112348222A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010383790.1A CN112348222A (zh) 2020-05-08 2020-05-08 一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010383790.1A CN112348222A (zh) 2020-05-08 2020-05-08 一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法

Publications (1)

Publication Number Publication Date
CN112348222A true CN112348222A (zh) 2021-02-09

Family

ID=74358128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010383790.1A Pending CN112348222A (zh) 2020-05-08 2020-05-08 一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法

Country Status (1)

Country Link
CN (1) CN112348222A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128395A (zh) * 2021-04-16 2021-07-16 重庆邮电大学 基于混合卷积的多级特征融合模型的视频动作识别方法及系统
CN113743594A (zh) * 2021-09-30 2021-12-03 中国联合网络通信集团有限公司 网络流量预测模型建立方法、装置、电子设备及存储介质
CN113794695A (zh) * 2021-08-26 2021-12-14 浙江工业大学 一种基于gru的网络异常流量检测识别方法
CN113962358A (zh) * 2021-09-29 2022-01-21 西安交通大学 一种基于时序超图注意力神经网络的信息扩散预测方法
CN114205250A (zh) * 2021-12-09 2022-03-18 西安电子科技大学 基于时空网络stn的虚拟网络链路流量预测方法
WO2022227219A1 (zh) * 2021-04-30 2022-11-03 平安科技(深圳)有限公司 房产指数数据分析方法、装置、设备及存储介质
CN115809747A (zh) * 2023-02-06 2023-03-17 东南大学 一种基于金字塔式因果网络的耦合信息流长期预测方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128395A (zh) * 2021-04-16 2021-07-16 重庆邮电大学 基于混合卷积的多级特征融合模型的视频动作识别方法及系统
CN113128395B (zh) * 2021-04-16 2022-05-20 重庆邮电大学 基于混合卷积的多级特征融合模型的视频动作识别方法及系统
WO2022227219A1 (zh) * 2021-04-30 2022-11-03 平安科技(深圳)有限公司 房产指数数据分析方法、装置、设备及存储介质
CN113794695A (zh) * 2021-08-26 2021-12-14 浙江工业大学 一种基于gru的网络异常流量检测识别方法
CN113962358A (zh) * 2021-09-29 2022-01-21 西安交通大学 一种基于时序超图注意力神经网络的信息扩散预测方法
CN113962358B (zh) * 2021-09-29 2023-12-22 西安交通大学 一种基于时序超图注意力神经网络的信息扩散预测方法
CN113743594A (zh) * 2021-09-30 2021-12-03 中国联合网络通信集团有限公司 网络流量预测模型建立方法、装置、电子设备及存储介质
CN113743594B (zh) * 2021-09-30 2023-12-05 中国联合网络通信集团有限公司 网络流量预测模型建立方法、装置、电子设备及存储介质
CN114205250A (zh) * 2021-12-09 2022-03-18 西安电子科技大学 基于时空网络stn的虚拟网络链路流量预测方法
CN115809747A (zh) * 2023-02-06 2023-03-17 东南大学 一种基于金字塔式因果网络的耦合信息流长期预测方法
CN115809747B (zh) * 2023-02-06 2023-05-09 东南大学 一种基于金字塔式因果网络的耦合信息流长期预测方法

Similar Documents

Publication Publication Date Title
CN112348222A (zh) 一种基于因果逻辑和图卷积特征提取的网络耦合时序信息流预测方法
CN113158543B (zh) 一种软件定义网络性能智能预测方法
CN113053115B (zh) 一种基于多尺度图卷积网络模型的交通预测方法
CN110851782A (zh) 一种基于轻量级时空深度学习模型的网络流量预测方法
CN112801404A (zh) 一种基于自适应空间自注意力图卷积的交通预测方法
CN111460912B (zh) 基于级联高分辨卷积神经网络的密集人群计数算法
Zhang et al. LNTP: An end-to-end online prediction model for network traffic
Gao et al. Incorporating intra-flow dependencies and inter-flow correlations for traffic matrix prediction
CN113297972B (zh) 一种基于数据融合深度学习的变电站设备缺陷智能分析方法
CN115660135A (zh) 基于贝叶斯方法和图卷积的交通流预测方法及系统
Deng et al. Spatio-temporal neural structural causal models for bike flow prediction
Tang et al. Spatio-temporal latent graph structure learning for traffic forecasting
CN116596109A (zh) 一种基于门控时间卷积网络的交通流预测模型
CN115376317A (zh) 一种基于动态图卷积和时序卷积网络的交通流预测方法
CN117175588A (zh) 基于时空相关性的用电负荷预测方法及装置
CN116578858A (zh) 基于图神经网络的空压机故障预测与健康度评价方法及系统
CN115061444B (zh) 一种融合概率网络和强化学习的工艺参数实时优化方法
CN110020379B (zh) 一种基于深度动态网络嵌入表示模型的链路预测方法
CN111935766B (zh) 一种基于全局空间依赖性的无线网络流量预测方法
Wan et al. Capturing Spatial-Temporal Correlations with Attention Based Graph Convolutional Networks for Network Traffic Prediction
CN117336187B (zh) 一种基于连边间关联的无人机通信网络推断方法
CN114912169B (zh) 基于多源信息融合的工业建筑供热自主优化调控方法
Zhong et al. Traffic prediction of converged network for smart gird based on GNN and LSTM
Zhang et al. Spatiotemporal Graph Neural Network for Traffic Prediction Exploiting Cascading Behavior
Zhu et al. ASTHGCN: Adaptive Spatio-Temporal Hypergraph Convolutional Network for Traffic Forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination