CN114417063A - 一种基于多视图的图神经网络的重要节点识别方法 - Google Patents

一种基于多视图的图神经网络的重要节点识别方法 Download PDF

Info

Publication number
CN114417063A
CN114417063A CN202110664305.2A CN202110664305A CN114417063A CN 114417063 A CN114417063 A CN 114417063A CN 202110664305 A CN202110664305 A CN 202110664305A CN 114417063 A CN114417063 A CN 114417063A
Authority
CN
China
Prior art keywords
nodes
neural network
network
graph
view
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110664305.2A
Other languages
English (en)
Inventor
王崇骏
袁金亮
徐鸣
孙浩然
张雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202110664305.2A priority Critical patent/CN114417063A/zh
Publication of CN114417063A publication Critical patent/CN114417063A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多视图的图神经网络的重要节点识别方法,从社交平台上获取用户信息;根据用户信息将所有用户表示为节点,用户之间的关系表示为连边,用户的相关属性表示为特征,建立网络图结构;扩展为多视图,从不同角度描述数据,在不同视图上使用图神经网络的方法得到节点的嵌入;利用高阶的拓扑结构矩阵表示节点之间的关系,使用注意力的方法融合多视图信息,得到节点最终的表示,预测节点的重要性,得到端到端训练模型,识别出重要的节点;本发明不仅能够提高模型的表达能力,同时能够泛化到没有明显图结构的数据上,提取新的关系,建立图结构,利用图神经网络模型,提高网络中重要节点识别的性能。

Description

一种基于多视图的图神经网络的重要节点识别方法
技术领域
本发明涉及网络中重要节点识别,主要使用图神经网络的方法,从多视图的角度学习节点的表示,然后使用多层感知器得到节点的重要性评分。
背景技术
网络是描述现实世界中普遍存在的对象与对象之间关系的一种数据形式,如神经系统网络、生物网络、交通网络、社交网络、金融交易网络等等。大量的物理学家开始研究现实世界中更加复杂多变的网络,发展出复杂网络这一研究方向,研究者们主要从统计物理的角度研究复杂网络模型如小世界网和无标度网等)及其复杂结构(如社团、层次、节点分类等)、网络上的动力学(如信息传播、网络演化等)等等。最近十几年,得益于机器学习,特别是深度学习的快速发展,研究者开始从机器学习的角度研究网络。
目前,深度学习已经成为人工智能领域最炙手可热的技术之一,在图像、语音和自然语言处理领域表现出最优的性能。基于通用近似理论,深度学习架构能够拟合现实世界中非常复杂的函数,因此深度学习模型在提取数据底层复杂模式的表达能力被广泛认可。然而网络作为表示关系数据的一般形式,深度学习处理网络数据却是一个难点,如何利用深度学习技术进行复杂的网络数据分析已经吸引了大量的研究者。
将传统深度学习技术扩展到网络领域主要存在以下挑战。首先网络是不规则领域,同图像、文本具有清晰的网格结构不同,网络数据是非欧几里得空间,传统的卷积、池化等操作难以直接用到网络数据上。其次是可扩展性,大数据时代,实际的网络数据经常数百万,甚至数十亿规模,例如社交网络、电商交易网络等,算法的可扩展性是其能否落地的关键因素。然后是网络数据的多变性,网络可以是无向图和有向图、静态的和动态的、有符号的和无符号的、同质的和异质的等等,处理不同的数据类型需要设计不同的模型架构。最后是跨学科,网络通常和其他学科,如化学、生物等学科息息相关,结合领域知识设计模型更加困难,例如分子图生成,目标函数和化学约束通常不可微分,无法使用梯度下降的训练方式。
重要节点识别是网络分析中一个重要的问题,传统上使用启发式的算法,基于网络的拓扑节点,例如节点度,k-shell,接近中心性等方法来识别重要的节点。使用图神经网络的方法,可以同时利用拓扑结构和节点丰富的属性信息以及神经网络强大的拟合能力,更好的识别出重要的节点。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于多视图的图神经网络的重要节点识别方法,本发明基于图神经网络的方法识别网络中重要的节点,潜在的应用场景包括众包(指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的而且通常是大型的大众志愿者的做法),利用社交网络识别重要的大众志愿者,能够更好的完成任务。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于多视图的图神经网络的重要节点识别方法,包括如下步骤:
步骤1,数据采集阶段,从社交平台上获取用户信息。
步骤2,数据预处理阶段:对用户信息进行预处理,然后根据预处理的用户信息将所有用户表示为节点,用户之间的关系表示为连边,用户的相关属性表示为特征,建立网络图结构。
步骤3,网络嵌入阶段:根据步骤2得到的网络图结构的基础上,扩展为多视图,从不同角度描述数据,在不同视图上使用图神经网络的方法得到节点的嵌入。
步骤4,计算多视图:利用高阶的拓扑结构矩阵表示节点之间的关系。
步骤5,重要节点识别阶段:基于步骤4得到的高阶的拓扑结构矩阵表示节点之间的关系使用注意力的方法融合多视图信息,得到节点最终的表示,预测节点的重要性,得到端到端训练模型,识别出重要的节点。
优选的:步骤2中建立网络数据的方法
步骤2a),对用户信息中数据缺失的属性进行补0。
步骤2b),将所有用户表示为节点,用户之间的关系表示为连边建立图结构。
步骤2c),用户的相关属性处理为网络中节点的特征,得到网络图结构。
优选的:步骤4中利用高阶的拓扑结构矩阵表示节点之间的关系的方法如下:
步骤4a),在图上进行信息传播是获得节点之间相似性的一种方法,传播能够得到节点对之间的高阶拓扑结构相似性,首先使用个性化的PageRank方法得到传播矩阵。
步骤4b),基于节点的特征向量矩阵,计算得到图数据的另一种视图-特征相似性矩阵。
步骤4c),基于步骤2得到的网络图结构、步骤4a)得到的传播矩阵、步骤4b)得到特征相似性矩阵,得到三种视图,分别从局部接近性、全局接近性和特征相似性三个方面描述网络中节点之间的关系。
步骤4d),步骤4c)得到的三种视图分别使用图卷积神经网络得到节点的表示。
优选的:步骤5中识别出重要节点的方法如下:
步骤5a),使用通道注意力机制融合三种视图下节点的表示。
步骤5b),基于节点的表示使用多层感知器计算得到节点的重要性评分。
步骤5c),基于神经网络学习到的节点重要性评分,计算排序损失,得到端到端训练模型。
步骤5d),根据步骤5a)-步骤5c),构造出一个端到端的基于多视图的图神经网络。
优选的:步骤1用户信息包括年龄、性别、职业、教育背景、粉丝、关注。
本发明相比现有技术,具有以下有益效果:
1,相对于传统的基于网络拓扑信息识别中的节点,本发明使用图神经网络的方法,能够同时利用拓扑信息和节点的属性信息。
2,基于多视图的方法融合网络数据的多视图信息,能够得到比较完整的数据信息,刻画真实的数据分布。同时基于通道注意力的方法能够自适应融合不同视图的信息,学习到更优的节点表示。
3,该模型是端到端训练,数据驱动的,能够更准确的识别网络中的重要节点。
附图说明
图1为本发明的方法整体流程图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于多视图的图神经网络的重要节点识别方法,如图1所示,包括如下步骤:
步骤1,数据采集阶段,从社交平台上获取足够多的用户,提取年龄、性别、职业、教育背景、粉丝、关注等属性的数据。
步骤2,数据预处理阶段:对用户信息进行预处理,然后根据预处理的用户信息将所有用户表示为节点,用户之间的关系表示为连边,用户的相关属性表示为特征,建立网络图结构。
步骤2a),对用户信息中数据缺失的属性进行补0。
步骤2b),将所有用户表示为节点,用户之间的关系表示为连边建立图结构。
步骤2c),用户的相关属性处理为网络中节点的特征,得到网络图结构。
步骤3,网络嵌入阶段:根据步骤2得到的网络图结构的基础上,扩展为多视图,从不同角度描述数据,在不同视图上使用图神经网络的方法得到节点的嵌入。
针对图卷积神经网络作为浅层的模型,只能学习到局部的结构问题,提出融合多视图信息的策略,提高模型的表达能力。
步骤4,计算多视图:邻接矩阵A是描述节点之间关系的一种表示,距离近的节点之间关系更紧密,传统的GCN一般堆叠两层,只能获得二阶邻居的信息。在图上,假设两个节点u,v之间有很多条路径可达,但是两个节点之间的最短路径大于2,虽然这两个节点关系紧密,但是GCN在得到u的隐藏表示时却无法利用节点v的信息。为此,本文提出利用高阶的拓扑结构矩阵表示节点之间的关系。
优选的:步骤4中利用高阶的拓扑结构矩阵表示节点之间的关系的方法如下:
步骤4a),在图上进行信息传播是获得节点之间相似性的一种方法,传播能够得到节点对之间的高阶拓扑结构相似性,首先使用个性化的PageRank方法得到传播矩阵:
SPPR=α(In-(1-α)D1/2AD1/2)-1
其中,SPPR表示传播矩阵,α表示系数,设置为0.15,In单位矩阵,D对角线元素为节点度的矩阵,A表示邻接矩阵。
步骤4b),基于节点的特征向量矩阵,计算得到图数据的另一种视图-特征相似性矩阵。
Figure BDA0003116684330000041
其中,
Figure BDA0003116684330000042
表示节点i和节点j的特征相似性,xi表示节点i的特征,xj表示节点j的特征,n表示节点数量。
步骤4c),基于步骤2得到的网络图结构、步骤4a)得到的传播矩阵、步骤4b)得到特征相似性矩阵,得到三种视图,分别从局部接近性、全局接近性和特征相似性三个方面描述网络中节点之间的关系。
步骤4d),步骤4c)得到的三种视图分别使用图卷积神经网络得到节点的表示。
步骤5,重要节点识别阶段:基于步骤4得到的高阶的拓扑结构矩阵表示节点之间的关系使用通道注意力机制融合三种视图下的节点嵌入,得到节点最终的表示,预测节点的重要性,得到端到端训练模型,识别出重要的节点。
步骤5a),使用通道注意力机制融合三种视图下节点的表示。
步骤5b),基于节点的表示使用多层感知器计算得到节点的重要性评分。
步骤5c),基于神经网络学习到的节点重要性评分,计算排序损失,得到端到端训练模型。
步骤5d),根据步骤5a)-步骤5c),构造出一个端到端的基于多视图的图神经网络。
综上所述,本发明提出了一种基于多视图的图神经网络的重要节点识别方法。相对于传统的网络重要节点识别方法,基于图神经网络的方法同时考虑网络拓扑结构信息和节点属性信息,同时针对图卷积神经网络作为浅层的模型,只能学习到局部的结构问题,提出融合多视图信息的策略,提高模型的表达能力。
本发明基于图神经网络的方法识别网络中的重要节点,同时考虑网络拓扑结构信息和节点属性信息,以及针对图卷积神经网络作为浅层的模型,只能学习到局部的结构问题,提出融合多视图信息的策略,提高模型的表达能力。同时能够泛化到没有明显图结构的数据上,提取新的关系,建立图结构,利用图神经网络模型,提高网络中重要节点识别的性能。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于多视图的图神经网络的重要节点识别方法,其特征在于,包括如下步骤:
步骤1,数据采集阶段,从社交平台上获取用户信息;
步骤2,数据预处理阶段:对用户信息进行预处理,然后根据预处理的用户信息将所有用户表示为节点,用户之间的关系表示为连边,用户的相关属性表示为特征,建立网络图结构;
步骤3,网络嵌入阶段:根据步骤2得到的网络图结构的基础上,扩展为多视图,从不同角度描述数据,在不同视图上使用图神经网络的方法得到节点的嵌入;
步骤4,计算多视图:利用高阶的拓扑结构矩阵表示节点之间的关系;
步骤5,重要节点识别阶段:基于步骤4得到的高阶的拓扑结构矩阵表示节点之间的关系使用注意力的方法融合多视图信息,得到节点最终的表示,预测节点的重要性,得到端到端训练模型,识别出重要的节点。
2.根据权利要求1所述一种基于多视图的图神经网络的重要节点识别方法,其特征在于:步骤2中建立网络数据的方法
步骤2a),对用户信息中数据缺失的属性进行补0;
步骤2b),将所有用户表示为节点,用户之间的关系表示为连边建立图结构;
步骤2c),用户的相关属性处理为网络中节点的特征,得到网络图结构。
3.根据权利要求2所述一种基于多视图的图神经网络的重要节点识别方法,其特征在于:步骤4中利用高阶的拓扑结构矩阵表示节点之间的关系的方法如下:
步骤4a),在图上进行信息传播是获得节点之间相似性的一种方法,传播能够得到节点对之间的高阶拓扑结构相似性,首先使用PageRank方法得到传播矩阵;
步骤4b),基于节点的特征向量矩阵,计算得到图数据的另一种视图-特征相似性矩阵;
步骤4c),基于步骤2得到的网络图结构、步骤4a)得到的传播矩阵、步骤4b)得到特征相似性矩阵,得到三种视图,分别从局部接近性、全局接近性和特征相似性三个方面描述网络中节点之间的关系;
步骤4d),步骤4c)得到的三种视图分别使用图卷积神经网络得到节点的表示。
4.根据权利要求3所述一种基于多视图的图神经网络的重要节点识别方法,其特征在于:步骤5中识别出重要节点的方法如下:
步骤5a),使用通道注意力机制融合三种视图下节点的表示;
步骤5b),基于节点的表示使用多层感知器计算得到节点的重要性评分;
步骤5c),基于神经网络学习到的节点重要性评分,计算排序损失,得到端到端训练模型;
步骤5d),根据步骤5a)-步骤5c),构造出一个端到端的基于多视图的图神经网络。
5.根据权利要求4所述一种基于多视图的图神经网络的重要节点识别方法,其特征在于:步骤1用户信息包括年龄、性别、职业、教育背景、粉丝、关注。
CN202110664305.2A 2021-06-16 2021-06-16 一种基于多视图的图神经网络的重要节点识别方法 Pending CN114417063A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110664305.2A CN114417063A (zh) 2021-06-16 2021-06-16 一种基于多视图的图神经网络的重要节点识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110664305.2A CN114417063A (zh) 2021-06-16 2021-06-16 一种基于多视图的图神经网络的重要节点识别方法

Publications (1)

Publication Number Publication Date
CN114417063A true CN114417063A (zh) 2022-04-29

Family

ID=81260664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110664305.2A Pending CN114417063A (zh) 2021-06-16 2021-06-16 一种基于多视图的图神经网络的重要节点识别方法

Country Status (1)

Country Link
CN (1) CN114417063A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114818948A (zh) * 2022-05-05 2022-07-29 北京科技大学 一种图神经网络的数据-机理驱动的材料属性预测方法
CN115906946A (zh) * 2022-12-11 2023-04-04 山西大学 一种多视图双曲-双曲图表示学习方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114818948A (zh) * 2022-05-05 2022-07-29 北京科技大学 一种图神经网络的数据-机理驱动的材料属性预测方法
CN114818948B (zh) * 2022-05-05 2023-02-03 北京科技大学 一种图神经网络的数据-机理驱动的材料属性预测方法
CN115906946A (zh) * 2022-12-11 2023-04-04 山西大学 一种多视图双曲-双曲图表示学习方法
CN115906946B (zh) * 2022-12-11 2024-04-12 山西大学 一种多视图双曲-双曲图表示学习方法

Similar Documents

Publication Publication Date Title
CN111488734B (zh) 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN111931903B (zh) 一种基于双层图注意力神经网络的网络对齐方法
CN112084335B (zh) 一种基于信息融合的社交媒体用户账号分类方法
CN112199608B (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN110399518B (zh) 一种基于图卷积的视觉问答增强方法
CN109284406B (zh) 基于差异循环神经网络的意图识别方法
CN112308115B (zh) 一种多标签图像深度学习分类方法及设备
CN112016601B (zh) 基于知识图谱增强小样本视觉分类的网络模型构建方法
El Mohadab et al. Predicting rank for scientific research papers using supervised learning
CN112925908A (zh) 一种基于Attention的图注意力网络的文本分类方法及系统
CN114417063A (zh) 一种基于多视图的图神经网络的重要节点识别方法
CN116664719B (zh) 一种图像重绘模型训练方法、图像重绘方法及装置
CN112685504A (zh) 一种面向生产过程的分布式迁移图学习方法
CN113761250A (zh) 模型训练方法、商户分类方法及装置
CN113255798A (zh) 一种分类模型训练方法、装置、设备及介质
CN115687760A (zh) 一种基于图神经网络的用户学习兴趣标签预测方法
CN116010813A (zh) 基于图神经网络融合标签节点影响度的社区检测方法
CN113240086A (zh) 一种复杂网络链接预测方法及系统
CN110245682B (zh) 一种基于话题的网络表示学习方法
CN113868537B (zh) 一种基于多行为会话图融合的推荐方法
CN117726884B (zh) 对象类别识别模型的训练方法、对象类别识别方法及装置
Duin et al. A note on core research issues for statistical pattern recognition
CN113779520B (zh) 基于多层属性分析的跨空间目标虚拟身份关联方法
CN116306834A (zh) 一种基于全局路径感知图神经网络模型的链路预测方法
CN114265954B (zh) 基于位置与结构信息的图表示学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination