CN110598061A - 一种多元图融合的异构信息网嵌入方法 - Google Patents
一种多元图融合的异构信息网嵌入方法 Download PDFInfo
- Publication number
- CN110598061A CN110598061A CN201910893511.3A CN201910893511A CN110598061A CN 110598061 A CN110598061 A CN 110598061A CN 201910893511 A CN201910893511 A CN 201910893511A CN 110598061 A CN110598061 A CN 110598061A
- Authority
- CN
- China
- Prior art keywords
- metagraph
- network
- graph
- meta
- embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种多元图融合的异构信息网嵌入方法,包括以下步骤:1)元图发现:根据异构信息网的特性选择频繁元图集合,以涵盖网络的重要语义特征;2)基于多元图融合的网络嵌入:利用适用于非对称元图的相似度度量方法计算异构信息网节点的相似度矩阵,并将该矩阵作为后续嵌入模型的原始特征;3)利用神经网络进行节点嵌入。采用本发明的异构网络嵌入方法,一方面,可以挖掘代表当前网络结构和语义特征的重要元图;一方面,提出的基于元图的节点相似度度量方法更具有通用性,并且通过原始特征的降维和融合,可以根据当前网络的特性计算不同元图的重要性,提高嵌入的准确性。
Description
技术领域
本发明涉及异构信息网的数据挖掘领域,具体为一种多元图融合的异构信息网嵌入方法。
背景技术
网络表示学习是将网络嵌入到低维空间中,可以将网络中的节点、边或图表示成向量形式。这种表示形式能够更多保留节点的网络结构或者语义信息,因此可以将该向量表示作为特征应用到各种数据挖掘任务当中。
当前已有许多针对同构网络嵌入的研究成果,和部分面向异构网络嵌入的研究。利用元路径进行网络嵌入是提取异构网络特征的常用方法,但是元路径结构简单,可能会丢失一些重要的信息。元图可以获取到较元路径更复杂的信息,同时考虑节点间的元图和元路径会得到更好的嵌入结果。然而,已有方法大多由专家指定元路径和元图,类型较单一,不适用于大型复杂的网络,而且在指定元图和元路径时未考虑同类型网络各自的独特性,影响节点嵌入准确性。虽然已提出了一些针对异构网络元路径的发现算法,但是还没有见到关于元图的发现方法。部分研究利用频繁子图挖掘算法找到当前异构网络的频繁子图,将其作为元图,但是因为频繁子图算法生成的元图数量较大,并且在结构上可能存在很大程度的相似性,导致后续基于元图的相似度计算复杂度过高。
鉴于元路径是一种特殊形式的元图,本发明提出了一种元图发现方法。在各种复杂网络的数据挖掘应用场景下,该方法可以发现网络中的适量关键元图,这些元图可以提取原网络的各类重要信息,减少网络嵌入的信息损失。基于元图发现算法,本文提出一种多元图融合的异构网络嵌入方法,该方法利用自动编码器模型,进一步自适应地选择关键元结构并学习权重值,不仅能够更好地获取网络的结构和语义特征,还可能有效降低人为因素对嵌入结果的影响。
发明内容
针对现有技术中异构信息网嵌入方法的相似度计算复杂度过高等不足,本发明要解决的问题是提供一种各种复杂网络的数据挖掘应用场景下发现网络中的适量关键元图、减少网络嵌入的信息损失的多元图融合的异构信息网嵌入方法。
为解决上述技术问题,本发明采用的技术方案是:
本发明一种多元图融合的异构信息网嵌入方法,包括以下步骤:
1)元图发现:根据异构信息网的特性选择频繁元图集合,以涵盖网络的重要语义特征;
2)基于多元图融合的网络嵌入:利用适用于非对称元图的相似度度量方法计算异构信息网节点的相似度矩阵,并将该矩阵作为后续嵌入模型的原始特征;
3)利用神经网络进行节点嵌入。
步骤1)具体包括:
101)频繁元图挖掘:构建频繁边集合,选择包含目标节点的频繁边执行子图扩展;过滤掉不满足节点数量、节点类型等要求的子图,同时计算子图的频繁度;在子图集合中抽取满足设定的元图;
102)候选元图选择:每个元图表示为(x,y)T的矩阵形式,其中 x=(nt1,nt2,...,ntk),y=(et1,et2,...,etk),nti表示图的节点类型,etj表示图的边类型,两者的取值分别表示特定类型节点和边的数量;利用余弦相似度公式 (1)计算两图的结构相似度,n为类内子图的数量,a、b为两个不同的子图,i、j分别为x、y的第i和第j个分量;利用公式(2)计算类心(mx,my)T:
将生成的频繁元图根据其结构相似度聚成k个类别,每个类别再根据其类内子图的结构相关性,和不同类别的子图的结构差异性,投票选择出最能代表本类别元图的某一个或者某几个元图。
步骤102)中投票选择出最能代表本类别元图的某一个或者某几个元图,具体包括:
10201)在所有生成的频繁子图中随机选择k个对象作为初始类心;
10202)遍历所有对象,计算与k个类心的结构相似度,将其归类到相似度分数最高的类心所在的聚类中;
10203)根据聚类结果重新计算聚类中心;
10204)若新类心与之前的类心不同,则重复前两步,直到聚类结果不再变化;
10205)计算类内子图的结构相似度以及每个聚类中的子图到其他聚类中心的结构相似度;
10206)对每个子图与同一类别其他子图的结构相似度分数和类间差异度分数求和,找到最大值作为k个类的代表子图即候选元图。
步骤2)具体包括:
201)基于元图的节点相似度计算:从给定的元图中抽取若干条元路径,计算两点在不同元路径相遇概率的乘积作为节点在元图中的相遇概率,给定一个异构信息网,公式(3)PMp表示两点沿元路p的可达矩阵:
其中,是邻接矩阵的行归一化结果,表示Ai→Ai+1的转移概率矩阵,同时,邻接矩阵的按列归一化表示Ai+1→Ai的转移概率;
公式(4)表示两点沿元路径在中点类型M下相遇的概率:
其中,P1,P2,L Pk是构成元图的元路径集合,所以两者在中点类型M下相遇的概率表示为如下形式:
HeteMGSim(A1,Al+1|S)=HeteSim(A1,Al+1|P1)·HeteSim(A1,Al+1|P2)L HeteSim(A1,Al+1|Pk)
=HeteSim(A1,Al+1|P1LP1R)L HeteSim(A1,Al+1|PkLPkR)(5)
202)利用神经网络学习节点的向量表示:利用一种自动编码器模型作为多元图融合的无监督网络嵌入方法,首先对基于元图的相似度特征进行降维,然后学习不同元图的权重,最后融合不同元图下节点的向量表示;
在编码部分,公式(6)-(8)表示这些变量间的关系,xi为第i个节点的初始特征,为节点经过k个隐藏层编码后的向量表示,zi为最终的编码结果,Wk、bk为第k个隐藏层的参数,Φk为第k个元图,σ为sigmod函数:
在解码部分,公式(9)-(11)表示这些变量间的关系,表示第k个隐藏层参数,zi表示编码的结果,表示经过k个隐藏层解码后的向量表示,表示最终的解码结果:
该模型的目标函数是最小化网络中所有实例的原始特征向量与重构特征向量之间的编码损失,其损失函数表示为公式(12)的形式,v表示网络中所有节点,Φk为不同的元图,为表示节点在第k个元图中的初始特征和嵌入结果,为对应的权重值:
本发明具有以下有益效果及优点:
1.采用本发明的异构网络嵌入方法,一方面,可以挖掘代表当前网络结构和语义特征的重要元图;一方面,提出的基于元图的节点相似度度量方法更具有通用性,并且通过原始特征的降维和融合,可以根据当前网络的特性计算不同元图的重要性,提高嵌入的准确性。
2.采用本发明的异构信息网嵌入方法,可避免通过用户指定和监督学习生成元图造成的信息缺失问题;同时,利用无监督的自动编码器结构,可以自动学习网络中的关键元路径以及相应的权重值;另外,对基于元路径计算节点相似度方法的改进可以较好适应元图的应用场景,且具有更强的通用性。
附图说明
图1为本发明方法的总体流程图;
图2为本发明方法涉及的频繁元图图示。
具体实施方式
下面结合说明书附图对本发明作进一步阐述。
如图1所示,本发明一种多元图融合的异构信息网嵌入方法,包括以下步骤:
1)元图发现:异构信息网的特性选择频繁元图集合,以涵盖网络的重要语义特征;
2)基于多元图融合的网络嵌入:利用适用于非对称元图的相似度度量方法计算异构信息网中的节点的相似度矩阵,并将该矩阵作为后续嵌入模型的原始特征;
3)利用神经网络进行节点嵌入。
步骤1)具体包括:
101)频繁元图挖掘:构建频繁边集合,选择包含目标节点的频繁边执行子图扩展;过滤掉不满足节点数量、节点类型等要求的子图,同时计算子图的频繁度;在子图集合中抽取满足设定的元图;
102)候选元图选择:每个元图表示为(x,y)T的矩阵形式,其中 x=(nt1,nt2,...,ntk),y=(et1,et2,...,etk),nti表示图的节点类型,etj表示图的边类型,两者的取值分别表示特定类型节点和边的数量,n表示类内子图的数量, a、b表示两个不同的子图,i、j分别表示x、y的第i和第j个分量;利用余弦相似度公式(1)计算两图的结构相似度,利用公式(2)计算类心 (mx,my)T:
将生成的频繁元图根据其结构相似度聚成k个类别,每个类别再根据其组内类内的结构相关性,和组间类间的结构差异性,投票选择出最能代表本类别元图的某一个或者某几个元图。
步骤102)中投票选择出最能代表本类别元图的某一个或者某几个元图,具体包括:
10201)在所有生成的频繁子图中随机选择k个对象作为初始类心;
10202)遍历所有对象,计算与k个类心的结构相似度,将其归类到相似度分数最高的类心所在的聚类中;
10203)根据聚类结果重新计算聚类中心;
10204)若新类心与之前的类心不同,则重复前两步,直到聚类结果不再变化;
10205)计算类内子图的结构相似度以及每个聚类中的子图到其他聚类中心的结构相似度;
10206)对每个子图的与同一类别其他子图的结构相似度分数和类间差异度分数求和,找到最大值作为k个类的代表子图即候选元图。
步骤2)具体包括:
201)基于元图的节点相似度计算:从给定的元图中抽取若干条元路径,计算两点在不同元路径相遇概率的乘积作为节点在元图中的相遇概率,给定一个异构信息网,公式(3)PMp表示两点沿元路径的可达矩阵:
其中,是邻接矩阵的行归一化结果,表示Ai→Ai+1的转移概率矩阵,同时,邻接矩阵的按列归一化表示Ai+1→Ai的转移概率;
公式(4)表示两点沿元路径在中点类型M下相遇的概率:
其中,P1,P2,L Pk是构成元图的元路径集合,所以两者在中点类型M下相遇的概率表示为如下形式:
HeteMGSim(A1,Al+1|S)=HeteSim(A1,Al+1|P1)·HeteSim(A1,Al+1|P2)L HeteSim(A1,Al+1|Pk)
=HeteSim(A1,Al+1|P1LP1R)L HeteSim(A1,Al+1|PkLPkR) (5)
202)利用神经网络学习节点的向量表示:利用一种自动编码器模型作为多元图融合的无监督网络嵌入方法,首先对基于元图的相似度特征进行降维,然后学习不同元图的权重,最后融合不同元图下节点的向量表示;
在编码部分,公式(6)-(8)表示这些变量间的关系,xi表示第i个节点的初始特征,表示节点经过k个隐藏层编码后的向量表示,zi表示最终的编码结果,Wk、bk表示第k个隐藏层的参数,Φk表示第k个元图,σ表示sigmod函数:
在解码部分,公式(9)-(11)表示这些变量间的关系,表示第k个隐藏层参数,zi表示编码的结果,表示经过k个隐藏层解码后的向量表示,表示最终的解码结果:
该模型的目标函数是最小化网络中所有实例的原始特征向量与重构特征向量之间的编码损失,其损失函数表示为公式(12)的形式,v表示网络中所有节点,Φk表示不同的元图,分别表示节点在第k个元图中的初始特征和嵌入结果,表示对应的权重值:
下面以DBLP数据集为例,对本发明方法进行具体说明。
DBLP数据集包含文章以及文章的作者、会议、参考文献、关键词等多种属性信息。在数据集中选择发表论文数量较多的作者集合,以及论文数量较多的会议和期刊,利用论文及其属性信息构建异构网络。网络链接包括author-paper、paper-venue、paper-paper、paper-term四种类型。随机选择 author类型的节点对,根据节点对是否处于同一语义类别划分正样本和负样本,用准确率、召回率度量不同算法的执行效果。
首先,如图2所示,构建异构网络,挖掘频繁元图。本步首先需要设置元图的起始点类型和元图的大小,比如将起始点类型均设置为author,元图的节点数量最多为10个,频繁度阈值设为2,则可以得到以下的频繁元图:APA、APVPA、APTPA、APPA、APPPA、APT(V)PA,其中P表示paper, A表示author,V表示venue,T表示term。
然后,执行元图选择,利用k-means算法进行元图聚类,选择代表当前网络结构和语义信息的关键元图。例如,针对当前网络,可以得到的元图包括:APTPA、APA、APT(V)PA。
接着,计算节点相似度。根据选择的正负样本,计算作者节点对基于不同元图的相似度分数,构成对应的相似度矩阵,作为神经网络模型的输入。比如在当前网络中计算作者节点间基于APA的相似度,如表(a)、(b)所示对网络的邻接矩阵执行归一化,作为A→P、P→A的转移概率矩阵。针对特定元路径,起始点的相似度可以由两者到路径中点的转移概率相乘进而归一化得到,如表(c)。
(a)
(b)
(c)
最后,利用神经网络进行节点嵌入。矩阵的行可以表示在特定元图下的某一作者与其他作者的相似度分数。针对当前网络,神经网络模型的输入是分别对应APA、APT(V)PA的特征矩阵(d)、(e):
author1 | author2 | author3 | author4 | |
author1 | 1 | 0.4082 | 0 | 0.7071 |
author2 | 0.4082 | 1 | 0.5774 | 0 |
author3 | 0 | 0.5774 | 1 | 0 |
author4 | 0.7071 | 0 | 0 | 1 |
(d)
author1 | author2 | author3 | author4 | |
author1 | 1 | 1 | 0 | 1 |
author2 | 1 | 1 | 0 | 1 |
author3 | 1 | 1 | 0 | 1 |
author4 | 1 | 1 | 0 | 1 |
(e)
每个元图对应的相似度矩阵,都需要执行一系列独立的编码和解码操作,同时为了融合不同元图的信息,增加了编码阶段潜在特征整合的隐藏层和解码阶段潜在特征分解的隐藏层。将编码结果作为作者节点的嵌入向量,具体结果如表(f)所示,然后计算目标节点对的余弦相似度,根据正负样本在节点的topk排序计算链路预测的准确率和召回率。比如针对 author1,按照相似度大小的节点排序是author1>author2>author4>author3,假设正样本排名在前两位即视为依据领域类别的链路预测结果正确,同样负样本排名在后两位视为预测正确,在本实例中author1与author2属于同一研究领域,而author1与author3属于不同领域,由此可以看到对应正负样本(author1,author2)(auhtor1,author3)的研究领域预测均正确。在整个案例中,随机选取正样本(author1,author2)(author2,author4)(author2, author3)和负样本(author1,author3)(author3,author4),根据节点嵌入向量(f),计算预测的准确率和召回率分别为0.80和0.67,可以看到两个指标值都很高。
所以本文提出的多元图融合的异构信息网嵌入方法有较好的链路预测效果。
author1 | author2 | author3 | author4 | |
author1 | 0.9571 | 0.8674 | 0.2057 | 0.8359 |
author2 | 0.6291 | 0.9301 | 0.3872 | 0.5974 |
author3 | 0.4391 | 0.6124 | 0.9428 | 0.2622 |
author4 | 0.6035 | 0.7726 | 0.0717 | 0.9442 |
(f)
下表为本发明方法与其他方法的对比图表,通过比较说明本方法计算的准确率和召回率都比较高,因此链路预测的效果较好。
Methods | Precision | Recall |
AD | 0.4456 | 0.2346 |
Dual-stage | 0.6816 | 0.3745 |
DeepWalk | 0.6667 | 0.2000 |
Meta2vec | 0.8734 | 0.0523 |
HE-MGF | 0.8774 | 0.4495 |
Claims (4)
1.一种多元图融合的异构信息网嵌入方法,其特征在于包括以下步骤:
1)元图发现:根据异构信息网的特性选择频繁元图集合,以涵盖网络的重要语义特征;
2)基于多元图融合的网络嵌入:利用适用于非对称元图的相似度度量方法计算异构信息网节点的相似度矩阵,并将该矩阵作为后续嵌入模型的原始特征;
3)利用神经网络进行节点嵌入。
2.根据权利要求1所述的多元图融合的异构信息网嵌入方法,其特征在于步骤1)具体包括:
101)频繁元图挖掘:构建频繁边集合,选择包含目标节点的频繁边执行子图扩展;过滤掉不满足节点数量、节点类型等要求的子图,同时计算子图的频繁度;在子图集合中抽取满足设定的元图;
102)候选元图选择:每个元图表示为(x,y)T的矩阵形式,其中x=(nt1,nt2,...,ntk),y=(et1,et2,...,etk),nti表示图的节点类型,etj表示图的边类型,两者的取值分别表示特定类型节点和边的数量;利用余弦相似度公式(1)计算两图的结构相似度,n为类内子图的数量,a、b为两个不同的子图,i、j分别为x、y的第i和第j个分量;利用公式(2)计算类心(mx,my)T:
将生成的频繁元图根据其结构相似度聚成k个类别,每个类别再根据其类内子图的结构相关性,和不同类别的子图的结构差异性,投票选择出最能代表本类别元图的某一个或者某几个元图。
3.根据权利要求1所述的多元图融合的异构信息网嵌入方法,其特征在于步骤102)中投票选择出最能代表本类别元图的某一个或者某几个元图,具体包括:
10201)在所有生成的频繁子图中随机选择k个对象作为初始类心;
10202)遍历所有对象,计算与k个类心的结构相似度,将其归类到相似度分数最高的类心所在的聚类中;
10203)根据聚类结果重新计算聚类中心;
10204)若新类心与之前的类心不同,则重复前两步,直到聚类结果不再变化;
10205)计算类内子图的结构相似度以及每个聚类中的子图到其他聚类中心的结构相似度;
10206)对每个子图与同一类别其他子图的结构相似度分数和类间差异度分数求和,找到最大值作为k个类的代表子图即候选元图。
4.根据权利要求1所述的多元图融合的异构信息网嵌入方法,其特征在于步骤2)具体包括:
201)基于元图的节点相似度计算:从给定的元图中抽取若干条元路径,计算两点在不同元路径相遇概率的乘积作为节点在元图中的相遇概率,给定一个异构信息网,公式(3)PMp表示两点沿元路p的可达矩阵:
其中,是邻接矩阵的行归一化结果,表示Ai→Ai+1的转移概率矩阵,同时,邻接矩阵的按列归一化表示Ai+1→Ai的转移概率;
公式(4)表示两点沿元路径在中点类型M下相遇的概率:
其中,P1,P2,L Pk是构成元图的元路径集合,所以两者在中点类型M下相遇的概率表示为如下形式:
HeteMGSim(A1,Al+1|S)=HeteSim(A1,Al+1|P1)·HeteSim(A1,Al+1|P2)L HeteSim(A1,Al+1|Pk)
=HeteSim(A1,Al+1|P1LP1R)L HeteSim(A1,Al+1|PkLPkR) (5)
202)利用神经网络学习节点的向量表示:利用一种自动编码器模型作为多元图融合的无监督网络嵌入方法,首先对基于元图的相似度特征进行降维,然后学习不同元图的权重,最后融合不同元图下节点的向量表示;
在编码部分,公式(6)-(8)表示这些变量间的关系,xi为第i个节点的初始特征,为节点经过k个隐藏层编码后的向量表示,zi为最终的编码结果,Wk、bk为第k个隐藏层的参数,Φk为第k个元图,σ为sigmod函数:
在解码部分,公式(9)-(11)表示这些变量间的关系,表示第k个隐藏层参数,zi表示编码的结果,表示经过k个隐藏层解码后的向量表示,表示最终的解码结果:
该模型的目标函数是最小化网络中所有实例的原始特征向量与重构特征向量之间的编码损失,其损失函数表示为公式(12)的形式,v表示网络中所有节点,Φk为不同的元图,为表示节点在第k个元图中的初始特征和嵌入结果,为对应的权重值:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910893511.3A CN110598061A (zh) | 2019-09-20 | 2019-09-20 | 一种多元图融合的异构信息网嵌入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910893511.3A CN110598061A (zh) | 2019-09-20 | 2019-09-20 | 一种多元图融合的异构信息网嵌入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110598061A true CN110598061A (zh) | 2019-12-20 |
Family
ID=68861959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910893511.3A Pending CN110598061A (zh) | 2019-09-20 | 2019-09-20 | 一种多元图融合的异构信息网嵌入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110598061A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444331A (zh) * | 2020-03-12 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 基于内容的分布式特征提取方法、装置、设备及介质 |
CN111460314A (zh) * | 2020-01-14 | 2020-07-28 | 华中科技大学 | 一种基于三角子图划分的社交网络子图嵌入方法及系统 |
CN111598223A (zh) * | 2020-05-15 | 2020-08-28 | 天津科技大学 | 一种基于属性和结构深度融合的网络嵌入方法及其模型 |
CN111737535A (zh) * | 2020-06-22 | 2020-10-02 | 复旦大学 | 一种基于元结构和图神经网络的网络表征学习方法 |
CN113111134A (zh) * | 2021-04-21 | 2021-07-13 | 山东省人工智能研究院 | 一种基于自编码和注意力机制的异构图节点特征嵌入方法 |
CN113554100A (zh) * | 2021-07-28 | 2021-10-26 | 湖南科技大学 | 异构图注意力网络增强的Web服务分类方法 |
CN113762334A (zh) * | 2021-07-26 | 2021-12-07 | 南昌航空大学 | 一种采用深度强化学习评估异质社交网络关键节点的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451613A (zh) * | 2017-07-31 | 2017-12-08 | 广州市香港科大霍英东研究院 | 异构信息网络的半监督学习方法及装置 |
CN107491540A (zh) * | 2017-08-24 | 2017-12-19 | 济南浚达信息技术有限公司 | 一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法 |
CN107562795A (zh) * | 2017-08-01 | 2018-01-09 | 广州市香港科大霍英东研究院 | 基于异构信息网络的推荐方法及装置 |
CN109492132A (zh) * | 2018-10-26 | 2019-03-19 | 广州市香港科大霍英东研究院 | 异构信息网络嵌入的方法、系统、终端及存储介质 |
CN110083696A (zh) * | 2019-04-23 | 2019-08-02 | 安徽大学 | 基于元结构技术的全局引文推荐方法、推荐系统 |
-
2019
- 2019-09-20 CN CN201910893511.3A patent/CN110598061A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451613A (zh) * | 2017-07-31 | 2017-12-08 | 广州市香港科大霍英东研究院 | 异构信息网络的半监督学习方法及装置 |
CN107562795A (zh) * | 2017-08-01 | 2018-01-09 | 广州市香港科大霍英东研究院 | 基于异构信息网络的推荐方法及装置 |
CN107491540A (zh) * | 2017-08-24 | 2017-12-19 | 济南浚达信息技术有限公司 | 一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法 |
CN109492132A (zh) * | 2018-10-26 | 2019-03-19 | 广州市香港科大霍英东研究院 | 异构信息网络嵌入的方法、系统、终端及存储介质 |
CN110083696A (zh) * | 2019-04-23 | 2019-08-02 | 安徽大学 | 基于元结构技术的全局引文推荐方法、推荐系统 |
Non-Patent Citations (5)
Title |
---|
LICHAO SUN 等: "Joint Embedding of Meta-Path and Meta-Graph for Heterogeneous Information Networks", 《2018 IEEE INTERNATIONAL CONFERENCE ON BIG KNOWLEDGE (ICBK)》 * |
MOHAMMED ELSEIDY等: "GraMi: frequent subgraph and pattern mining in a single large graph", 《PROCEEDINGS OF THE VLDB ENDOWMENT》 * |
YANG FANG等: "M-HIN: Complex Embeddings for Heterogeneous Information Networks via Metagraphs", 《PROCEEDINGS OF THE 42ND INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL》 * |
孟晓峰: "基于异质信息网络的相似性度量研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
王旭: "异构信息网络中基于元结构的协同过滤算法", 《计算机科学》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460314A (zh) * | 2020-01-14 | 2020-07-28 | 华中科技大学 | 一种基于三角子图划分的社交网络子图嵌入方法及系统 |
CN111460314B (zh) * | 2020-01-14 | 2023-09-01 | 华中科技大学 | 一种基于三角子图划分的社交网络子图嵌入方法及系统 |
CN111444331A (zh) * | 2020-03-12 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 基于内容的分布式特征提取方法、装置、设备及介质 |
CN111444331B (zh) * | 2020-03-12 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 基于内容的分布式特征提取方法、装置、设备及介质 |
CN111598223A (zh) * | 2020-05-15 | 2020-08-28 | 天津科技大学 | 一种基于属性和结构深度融合的网络嵌入方法及其模型 |
CN111598223B (zh) * | 2020-05-15 | 2023-10-24 | 天津科技大学 | 一种基于属性和结构深度融合的网络嵌入方法及其模型 |
CN111737535A (zh) * | 2020-06-22 | 2020-10-02 | 复旦大学 | 一种基于元结构和图神经网络的网络表征学习方法 |
CN111737535B (zh) * | 2020-06-22 | 2022-10-18 | 复旦大学 | 一种基于元结构和图神经网络的网络表征学习方法 |
CN113111134A (zh) * | 2021-04-21 | 2021-07-13 | 山东省人工智能研究院 | 一种基于自编码和注意力机制的异构图节点特征嵌入方法 |
CN113762334A (zh) * | 2021-07-26 | 2021-12-07 | 南昌航空大学 | 一种采用深度强化学习评估异质社交网络关键节点的方法 |
CN113554100A (zh) * | 2021-07-28 | 2021-10-26 | 湖南科技大学 | 异构图注意力网络增强的Web服务分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598061A (zh) | 一种多元图融合的异构信息网嵌入方法 | |
CN108920720B (zh) | 基于深度哈希和gpu加速的大规模图像检索方法 | |
CN108733798B (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN108733976B (zh) | 基于融合生物与拓扑特征的关键蛋白质识别方法 | |
CN113807422B (zh) | 融合多特征信息的加权图卷积神经网络评分预测模型 | |
US11074274B2 (en) | Large scale social graph segmentation | |
CN112905583A (zh) | 一种高维大数据离群点检测方法 | |
CN109034953B (zh) | 一种电影推荐方法 | |
Gupte et al. | Role discovery in graphs using global features: Algorithms, applications and a novel evaluation strategy | |
CN108052683B (zh) | 一种基于余弦度量规则的知识图谱表示学习方法 | |
CN110110120B (zh) | 一种基于深度学习的图像检索方法和装置 | |
CN112905906B (zh) | 一种融合局部协同与特征交叉的推荐方法及系统 | |
CN117787411A (zh) | 一种基于关系图的局部-全局时序知识图谱推理方法 | |
WO2015109781A1 (zh) | 基于期望最大确定统计模型参数的方法和装置 | |
CN111914930A (zh) | 一种基于自适应微簇融合的密度峰值聚类方法 | |
Khalid et al. | Scalable and practical One-Pass clustering algorithm for recommender system | |
CN112738724B (zh) | 一种区域目标人群的精准识别方法、装置、设备和介质 | |
Chen et al. | Community Detection Based on DeepWalk Model in Large‐Scale Networks | |
CN110119465B (zh) | 融合lfm潜在因子与svd的手机应用用户喜好检索方法 | |
Morvan et al. | Graph sketching-based space-efficient data clustering | |
Rajput et al. | An efficient and generic hybrid framework for high dimensional data clustering | |
CN112733926A (zh) | 一种基于半监督的多层网络聚类方法 | |
CN114494753A (zh) | 聚类方法、装置、电子设备及计算机可读存储介质 | |
CN111488903A (zh) | 基于特征权重的决策树特征选择方法 | |
Tareq et al. | A new density-based method for clustering data stream using genetic algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191220 |