CN109740785A - 基于图卷积神经网络的节点状态预测的方法 - Google Patents
基于图卷积神经网络的节点状态预测的方法 Download PDFInfo
- Publication number
- CN109740785A CN109740785A CN201811228985.8A CN201811228985A CN109740785A CN 109740785 A CN109740785 A CN 109740785A CN 201811228985 A CN201811228985 A CN 201811228985A CN 109740785 A CN109740785 A CN 109740785A
- Authority
- CN
- China
- Prior art keywords
- network
- state
- node state
- node
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明公开了基于图卷积神经网络进行节点状态预测的方法。通过图卷积神经网络算法,我们可以输入数据的网络结构和某一时刻的节点状态,节点状态可以是连续的状态值或者是离散的类别状态,进而对下一时刻的节点状态进行预测。本发明中的对网络结构的数据进行节点状态预测是非常有意义的,并且可以应用到很多领域,比如交通网络上的流量预测,疾病传播网络上的染病情况预测等等。传统的状态预测的方法一般会忽略网络结构导致预测结果的不准确,因此本发明提出的基于网络结构对节点状态进行预测的方法不仅具有较好的效果,而且具有广阔的应用领域。
Description
技术领域
对网络结构的数据进行节点状态预测,具体涉及到图卷积神经网络算法技术领域。
背景技术
真实世界中,许多重要的数据都是以网络的形式存在的。网络数据,是由节点和连边构成的数据,表示对象及其相互之间的联系。现如今,网络已经是最常用的数据类型之一,比如城市之间的道路连接构成了交通网络、人与人之间的关系构成了社交网络、科研论文之间的引用构成了科学家合作网等等。对于不同的网络,节点和连边代表不同的含义,网络结构也体现了节点之间的相互影响关系。另外,对于网络数据来说,为了能够充分的体现数据所具有的信息,节点和连边还可以带有不同的属性,比如交通网络中节点代表道路,连边表示道路之间的连接关系,每一个节点上还可以具有一定时间段的交通流量等状态信息,而连边的长短表示道路之间的距离等等。对于含有节点状态信息的网络数据,节点状态一般都是时序的,也就是说节点状态是随着时间不断变化的,那么如果我们获取了前t个时刻的节点状态,是否可以对未来的节点状态进行预测呢?在本发明中,我们就是基于数据的网络结构和节点上第t个时刻的状态信息,对t+1时刻的节点状态进行预测的。
对未来的状态预测在实际应用中有非常重要的意义,比如在股票市场上,对股票未来价格趋势的预测可以帮助人们规避风险合理投资,再比如对于交通管理,对道路流量的预测可以帮助有关部门采取合理措施避免拥堵,总之,对未来状态的预测不仅可以在商业上创造更多的价值,也可以帮助人们更好的生活。传统的状态预测一般采用时序数据分析、递归神经网络(RNN)等的方法。然而对于网络数据的节点状态预测,比如交通网络的流量预测,疾病传播网络的疫情预测,贸易网络的贸易量预测等等,因为网络结构的存在,传统的方法很难直接应用,因此过去人们在处理数据的时候往往会忽略底层的网络结构,只考虑时序的节点状态信息。但是这样的做法漏掉了重要的网络结构信息,也就是不考虑节点之间的相互影响,对于预测结果必然是不利的。因此,在本发明中,我们考虑基于图卷积神经网络来对网络结构的数据进行未来节点状态进行预测。
图卷积神经网络(GCN)是最近一些文章提出的使用深度学习框架对网络数据进行处理的方法。GCN的输入是网络结构以及网络上每个节点的状态向量,输出是更新后的每个节点的向量表示,节点的新的向量表示不仅包含了当前节点的状态信息,还包含了其邻居节点的状态信息。得到了节点的新的向量表示之后,就可以对节点进行分类和聚类等等。GCN作为一种新兴的处理网络数据的方法,在网络节点分类,社团划分,链路预测等领域都有广泛的应用。本发明是基于图卷积神经网络对节点未来状态进行预测,我们的节点状态包含两种情况,一种是连续的状态值,另一种是离散的类别状态,因此在我们的输入中,除了网络结构,我们重新定义了节点的状态表示,连续的状态值比如是在交通网络中是当前时刻的交通流量值,离散的类别状态比如在传染病网络中节点当前的染病状态(未染病、染病或者痊愈)等,另外为了更好的适用于存在非线性变化的数据,我们修改了图卷积神经网络的架构,加入了带有非线性激活函数的线性层,我们的方法在一些数据的实验上取得了很好的效果。
发明内容
我们的方法是基于图卷积神经网络对网络的节点状态进行预测,网络的节点状态包括连续和离散两种情况,首先我们的输入是网络结构(用网络的邻接矩阵A表示),网络上每一个节点在t时刻的状态(数值或者是类别,比如交通流量值或者是用one-hot编码的染病未染病的状态),输入值经过我们提出的基于图卷积神经网络的架构(卷积层-2线性层-卷积层-线性层-输出层),最后输出一维的预测值或者是softmax处理之后的分类概率。我们方法的具体步骤如下:
1.获取数据和数据预处理
我们的方法适用于有网络结构(G)存在的数据,比如交通网络、贸易网络、传染病网络等等,我们用网络的邻接矩阵(A)来表示网络结构。邻接矩阵的表示为:
其中,i,j为节点,E为连边。无权无向图的邻接矩阵即i,j之间存在连边就记为1,否则就记为0。
另外我们输入当前时刻即t时刻的节点状态,而对于网络上的节点状态,连续的节点状态,我们直接用状态值作为输入,对于离散的节点状态,我们用one-hot编码节点的类别状态作为输入。
2.在模型中训练
我们的模型框架为卷积层-2线性层-卷积层-线性层-输出层,卷积层的计算公式为:
f(H(l),A)=σ(AH(l)W(l))
其中,H为l层的输入,A为邻接矩阵,W为待学习的参数,σ为激活函数,这里采用relu的激活函数。
线性层即MLP以及我们采用了relu的非线性激活函数。
模型通过梯度下降的方法进行训练。
整个框架中参数数量以及超参的设置根据不同的数据集可以进行调节。
3.预测效果评估
模型将会输出预测的t+1时刻的节点状态,其类型和模型的输入相同,即输出连续的状态值或者不同类别的概率,然后我们和t+1时刻真实的状态进行对比,连续的状态值计算均方误差(MSE),
离散的类别状态我们计算预测的准确率。
有益效果
1.本方法是网络数据中节点的未来状态进行预测中,结合了重要的网络结构信息,另外对未来状态的预测具有重要的现实意义和应用价值。
2.本方法中的节点状态表示包括连续状态值的和离散的类别状态,这也使得我们的方法的适用范围更加广泛,比如交通领域、股票市场、社交网络、疾病预防领域等等。
3.我们的模型框架易于训练可调节性大,因此也适用于大型网络结构的数据。
附图说明
图1为本网络节点状态预测算法示意图;
图2为伦敦交通数据截图;
图3中a为真实结果,b为预测结果对比图。
具体实施方式
下面结合附图,对本方法的具体技术细节进行详细说明。
本方法的思路是基于图卷积神经网络对节点的状态进行预测,我们的输入包括网络结构(用网络的邻接矩阵A表示),网络上每一个节点t时刻的状态(数值或者是类别),输入值经过我们提出的模型架构(卷积层-2线性层-卷积层-线性层-输出层),最后输出t+1时刻一维的预测值或者是softmax处理之后的分类概率。接下来以伦敦交通网络以及交通流量为例,详细介绍具体步骤,其中图2为伦敦交通数据截图,图3中a为真实结果,b为预测结果对比图:
步骤一:伦敦交通数据处理及建网
我们的数据集来源于伦敦政府网站上交通部门公开的数据(http://www.dft.gov.uk/statistics/series/traffic),数据包含了从2000年到2011年每一年每条道路的情况以及道路上的车辆总量,图2显示了某一年某些路段的情况,其中road即为道路,AllMotorvehicles为交通流量。我们对初始数据进行处理之后,将道路作为节点,根据StartJunction和EndJunction判断道路之间的交叉情况,有交叉的道路我们就建立连边,最终我们得到了伦敦的交通网络(可视化的伦敦路网见图3a),包含17672个节点,以及每一年每条道路上的交通流量。
步骤二:将数据放入模型进行训练
我们将步骤一得到的道路网以及每一年的交通流量作为输入,通过本发明中提出的模型,我们设置参数为第一个卷积层输出维度为16,两个线性层输出维度为20,第二个卷积层输出为度为32,线性层输出维度为20,最后输出层输出维度为1,因为交通流量为实值。另外我们设置学习率为0.01,迭代次数为80次。
步骤三:对预测结果进行评估
对于预测出的第二年的交通流量,我们计算了均方误差(MSE)。
其中,yi为真实结果,为预测结果,n为样本个数,即节点总数。
另外这里我们将预测出的每条道路的交通流量画在了伦敦地图上,颜色越重代表流量越高,同真实的交通流量进行了对比,可以看出预测的效果较好,见图3。
Claims (1)
1.基于图卷积神经网络进行节点状态预测的方法,其特征在于,具体步骤如下:
1)获取数据和数据预处理
适用于有网络结构(G)存在的数据,如交通网络、贸易网络、传染病网络,用网络的邻接矩阵(A)来表示网络结构,邻接矩阵的表示为:
其中,i,j为节点,E为连边,无权无向图的邻接矩阵即i,j之间存在连边就记为1,否则就记为0;
另外输入当前时刻即t时刻的节点状态,而对于网络上的节点状态,连续的节点状态,直接用状态值作为输入,对于离散的节点状态,用one-hot编码节点的类别状态作为输入;
2)在模型中训练
我们的模型框架为卷积层-2线性层-卷积层-线性层-输出层,卷积层的计算公式为:
f(H(l),A)=σ(AH(l)W(l))
其中,H为l层的输入,A为邻接矩阵,W为待学习的参数,σ为激活函数,这里采用relu的激活函数;
线性层即MLP以及我们采用了relu的非线性激活函数。
模型通过梯度下降的方法进行训练。
整个框架中参数数量以及超参的设置根据不同的数据集可以进行调节。
3)预测效果评估
模型将会输出预测的t+1时刻的节点状态,其类型和模型的输入相同,即输出连续的状态值或者不同类别的概率,然后我们和t+1时刻真实的状态进行对比,连续的状态值计算均方误差(MSE),
离散的类别状态我们计算预测的准确率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811228985.8A CN109740785A (zh) | 2018-10-22 | 2018-10-22 | 基于图卷积神经网络的节点状态预测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811228985.8A CN109740785A (zh) | 2018-10-22 | 2018-10-22 | 基于图卷积神经网络的节点状态预测的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109740785A true CN109740785A (zh) | 2019-05-10 |
Family
ID=66354313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811228985.8A Pending CN109740785A (zh) | 2018-10-22 | 2018-10-22 | 基于图卷积神经网络的节点状态预测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109740785A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175229A (zh) * | 2019-05-27 | 2019-08-27 | 言图科技有限公司 | 一种基于自然语言进行在线培训的方法和系统 |
CN110288170A (zh) * | 2019-07-29 | 2019-09-27 | 重庆电子工程职业学院 | 预测模型构建方法、交通流量预测方法、装置及电子设备 |
CN110459051A (zh) * | 2019-06-21 | 2019-11-15 | 平安国际智慧城市科技股份有限公司 | 路段特征模型训练方法、装置、终端设备及存储介质 |
CN110674869A (zh) * | 2019-09-23 | 2020-01-10 | 腾讯科技(深圳)有限公司 | 分类处理、图卷积神经网络模型的训练方法和装置 |
CN110991914A (zh) * | 2019-12-09 | 2020-04-10 | 朱递 | 一种基于图卷积神经网络的设施选址方法 |
CN110995520A (zh) * | 2020-02-28 | 2020-04-10 | 清华大学 | 网络流量预测方法、装置、计算机设备及可读存储介质 |
CN111812450A (zh) * | 2020-06-01 | 2020-10-23 | 复旦大学 | 一种电网危险故障的识别方法 |
CN112465253A (zh) * | 2020-12-09 | 2021-03-09 | 重庆邮电大学 | 一种城市路网中的链路预测方法及装置 |
CN112508456A (zh) * | 2020-12-25 | 2021-03-16 | 平安国际智慧城市科技股份有限公司 | 食品安全风险评估方法、系统、计算机设备及存储介质 |
CN112529311A (zh) * | 2020-12-16 | 2021-03-19 | 南京中兴力维软件有限公司 | 一种基于图卷积分析的道路流量预测方法和装置 |
CN112766551A (zh) * | 2021-01-08 | 2021-05-07 | 鹏城实验室 | 一种交通预测方法、智能终端及计算机可读存储介质 |
CN113838582A (zh) * | 2021-11-29 | 2021-12-24 | 中国人民解放军军事科学院军事医学研究院 | 一种基于区域相似度的传染病趋势预测方法和系统 |
WO2022105374A1 (zh) * | 2020-11-20 | 2022-05-27 | 中兴通讯股份有限公司 | 信息处理方法、模型的生成及训练方法、电子设备和介质 |
-
2018
- 2018-10-22 CN CN201811228985.8A patent/CN109740785A/zh active Pending
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175229B (zh) * | 2019-05-27 | 2021-07-06 | 言图科技有限公司 | 一种基于自然语言进行在线培训的方法和系统 |
CN110175229A (zh) * | 2019-05-27 | 2019-08-27 | 言图科技有限公司 | 一种基于自然语言进行在线培训的方法和系统 |
CN110459051A (zh) * | 2019-06-21 | 2019-11-15 | 平安国际智慧城市科技股份有限公司 | 路段特征模型训练方法、装置、终端设备及存储介质 |
CN110288170A (zh) * | 2019-07-29 | 2019-09-27 | 重庆电子工程职业学院 | 预测模型构建方法、交通流量预测方法、装置及电子设备 |
CN110288170B (zh) * | 2019-07-29 | 2020-04-14 | 重庆电子工程职业学院 | 预测模型构建方法、交通流量预测方法、装置及电子设备 |
CN110674869A (zh) * | 2019-09-23 | 2020-01-10 | 腾讯科技(深圳)有限公司 | 分类处理、图卷积神经网络模型的训练方法和装置 |
CN110674869B (zh) * | 2019-09-23 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 分类处理、图卷积神经网络模型的训练方法和装置 |
CN110991914A (zh) * | 2019-12-09 | 2020-04-10 | 朱递 | 一种基于图卷积神经网络的设施选址方法 |
CN110991914B (zh) * | 2019-12-09 | 2024-04-16 | 朱递 | 一种基于图卷积神经网络的设施选址方法 |
CN110995520A (zh) * | 2020-02-28 | 2020-04-10 | 清华大学 | 网络流量预测方法、装置、计算机设备及可读存储介质 |
CN110995520B (zh) * | 2020-02-28 | 2020-06-30 | 清华大学 | 网络流量预测方法、装置、计算机设备及可读存储介质 |
CN111812450B (zh) * | 2020-06-01 | 2022-03-18 | 复旦大学 | 一种电网危险故障的识别方法 |
CN111812450A (zh) * | 2020-06-01 | 2020-10-23 | 复旦大学 | 一种电网危险故障的识别方法 |
WO2022105374A1 (zh) * | 2020-11-20 | 2022-05-27 | 中兴通讯股份有限公司 | 信息处理方法、模型的生成及训练方法、电子设备和介质 |
EP4243360A4 (en) * | 2020-11-20 | 2024-04-10 | Zte Corp | INFORMATION PROCESSING METHOD, MODULE GENERATION AND DRIVE METHOD, ELECTRONIC DEVICE AND MEDIUM |
CN112465253B (zh) * | 2020-12-09 | 2022-07-01 | 重庆邮电大学 | 一种城市路网中的链路预测方法及装置 |
CN112465253A (zh) * | 2020-12-09 | 2021-03-09 | 重庆邮电大学 | 一种城市路网中的链路预测方法及装置 |
CN112529311A (zh) * | 2020-12-16 | 2021-03-19 | 南京中兴力维软件有限公司 | 一种基于图卷积分析的道路流量预测方法和装置 |
CN112508456A (zh) * | 2020-12-25 | 2021-03-16 | 平安国际智慧城市科技股份有限公司 | 食品安全风险评估方法、系统、计算机设备及存储介质 |
CN112766551A (zh) * | 2021-01-08 | 2021-05-07 | 鹏城实验室 | 一种交通预测方法、智能终端及计算机可读存储介质 |
CN113838582A (zh) * | 2021-11-29 | 2021-12-24 | 中国人民解放军军事科学院军事医学研究院 | 一种基于区域相似度的传染病趋势预测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740785A (zh) | 基于图卷积神经网络的节点状态预测的方法 | |
Moretti et al. | Urban traffic flow forecasting through statistical and neural network bagging ensemble hybrid modeling | |
CN111161535B (zh) | 基于注意力机制的图神经网络交通流量预测方法及系统 | |
Wang et al. | A novel model: Dynamic choice artificial neural network (DCANN) for an electricity price forecasting system | |
CN109887282A (zh) | 一种基于层级时序图卷积网络的路网交通流预测方法 | |
CN106650725A (zh) | 基于全卷积神经网络的候选文本框生成和文本检测方法 | |
CN108062561A (zh) | 一种基于长短时记忆网络模型的短时数据流预测方法 | |
CN107909206A (zh) | 一种基于深层结构循环神经网络的pm2.5预测方法 | |
Li et al. | Near-term train delay prediction in the Dutch railways network | |
CN107870957A (zh) | 一种基于信息增益和bp神经网络的热门微博预测方法 | |
Cheng et al. | Analysis and forecasting of the day-to-day travel demand variations for large-scale transportation networks: a deep learning approach | |
CN108122048A (zh) | 一种运输路径调度方法及其系统 | |
CN114944053A (zh) | 一种基于时空超图神经网络的交通流预测方法 | |
Ai et al. | A deep learning approach to predict the spatial and temporal distribution of flight delay in network | |
CN113762595A (zh) | 通行时间预测模型训练方法、通行时间预测方法及设备 | |
CN113345236A (zh) | 一种基于Transformer网络的时空交通状态预测方法 | |
CN115544239A (zh) | 一种基于深度学习模型的布局偏好预测方法 | |
CN113240086B (zh) | 一种复杂网络链接预测方法及系统 | |
Tokuyama et al. | The effect of using attribute information in network traffic prediction with deep learning | |
CN103544503B (zh) | 一种基于多实例马尔科夫模型的行为识别方法 | |
Acosta et al. | Predicting city safety perception based on visual image content | |
CN115456314B (zh) | 一种大气污染物时空分布预测系统及方法 | |
Li et al. | H∞ fault detection with randomly occurring nonlinearities and channel fadings | |
CN114842247B (zh) | 基于特征累加的图卷积网络半监督节点分类方法 | |
CN110460463A (zh) | 基于深度神经网络的服务质量预测方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190510 |