CN110136017A - 一种基于数据增强和非负矩阵稀疏分解的群组发现方法 - Google Patents

一种基于数据增强和非负矩阵稀疏分解的群组发现方法 Download PDF

Info

Publication number
CN110136017A
CN110136017A CN201910277684.2A CN201910277684A CN110136017A CN 110136017 A CN110136017 A CN 110136017A CN 201910277684 A CN201910277684 A CN 201910277684A CN 110136017 A CN110136017 A CN 110136017A
Authority
CN
China
Prior art keywords
matrix
group
node
probability
neighbor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910277684.2A
Other languages
English (en)
Inventor
熊贇
陈惠迪
朱扬勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN201910277684.2A priority Critical patent/CN110136017A/zh
Publication of CN110136017A publication Critical patent/CN110136017A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明属于大数据技术领域,具体为一种基于数据增强和非负矩阵稀疏分解的群组发现方法。本发明通过循环神经网络学习节点有属性的网络中不同属性的节点的邻居分布,抽取由多个节点的相似的邻居分布形成的邻居模式用以增强数据,再通过交替最小二乘和吉洪诺夫正则化进行非负矩阵的稀疏分解发现群组,提升群组发现的准确性。本发明通过数据增强对网络拓扑结构的边进行了填补,使得矩阵分解时尽量不迭代出全零的行,保证迭代稳定;并且,以非负矩阵稀疏分解的方法得到稀疏的群组表示,不会得到大量非零的概率,增强了群组发现方法的可解释性,解决了大量非零概率难以解释群组隶属关系的难题。

Description

一种基于数据增强和非负矩阵稀疏分解的群组发现方法
技术领域
本发明属于大数据技术领域,具体涉及基于深度学习的网络数据增强和非负矩阵稀疏分解的群组发现方法。
背景技术
现实中,各种各样的对象之间存在着联系与交互,这些对象以及它们之间的联系可以抽象成网络结构,或者称为图结构。联系或交互用网络中的边表示,而这些对象以及它们的属性在网络中则被表示为节点及其节点属性。分析这些网络数据,找出其中相似的点构成的集合,被称为群组发现任务。群组发现是大数据挖掘中的一项重要任务,例如,在社交网络中,网络节点代表了每一个人,而网络中的边则代表了他们之间存在的社交关系,比如同学关系、亲属关系、师生关系等。通过对社交网络的群组发现分析,得到每个人的社交圈,利用这些信息,能够进行好友推荐、商品推荐、社交关系的预测等。根据每个网络节点可以从属的群组数目,群组发现可以分为非重叠的群组发现和重叠的群组发现。非重叠的群组发现只允许每个节点只从属于一个群组;重叠的群组发现允许每个节点属于多于一个群组,比如社交网络中,某个人除了属于同事圈,还能属于社交朋友圈。
传统的基于矩阵分解的群组发现方法通常直接考虑当前给定的网络的拓扑结构,没有考虑在数据采集时可能缺失的边,例如尚未通过互加好友或关注建立的好友关系或同事关系等。另一方面,在非重叠群组发现任务上,矩阵分解的结果中某些节点可能最后计算得到的属于多个群组的概率相近,导致难以区分节点所属的群组;在重叠群组发现任务上,矩阵分解的结果可能每个群组都得到一个非零的概率,这也将导致难以判断节点是否属于该群组。
针对上述问题,本发明提出了一种基于数据增强和非负矩阵稀疏分解(Non-negative Matrix Factorization with Sparseness Constraints,NMFs)的群组发现方法。首先,通过利用循环神经网络(Recurrent Neural Network,RNN),学习各种不同节点属性的网络节点的邻居分布(称为邻居模式);接着,通过学习到的邻居模式增强在数据采集过程中损失的拓扑结构数据;同时,考虑到节点属性可能有缺失,可以利用邻居节点属性进行补充,我们采用拉普拉斯平滑的方法进行增强;最后,对增强后的数据通过非负矩阵稀疏分解的方法,计算出每个节点所属的群组。该方法与传统方法相比,不仅考虑了网络的拓扑结构,还考虑了网络的节点属性,并且利用这些信息对数据进行了增强,有助于提高准确率;同时,使得矩阵分解时尽量不迭代出全零的行以保证迭代稳定;进一步地,在非负矩阵分解的群组发现算法上应用了吉洪诺夫正则化进行稀疏分解。采用非负矩阵稀疏分解的方法可以用一个模型同时处理非重叠的群组发现和重叠的群组发现任务,同时由于分解得到的从属群组概率矩阵和群组特征矩阵都是稀疏矩阵,在非重叠群组发现任务上,使得每个节点属于某个群组的概率接近于1,而属于其他群组的概率接近于0。不同于非稀疏分解的方法得到某些节点可能属于多个群组的概率相近,导致难以判断节点隶属群组的关系;在重叠的群组发现任务上,稀疏分解方法能够使得每个节点属于不从属的群组的概率接近于0,而非稀疏分解的方法,可能每个群组得到一个非零的概率,导致难以区分节点到底属于其中哪几个群组。总的来说,以非负矩阵稀疏分解的方法得到稀疏的群组表示,稀疏分解使得每个节点远离了属于某个或者多个群组的划分边界,同时避免了产生大量难以解释的非零的概率,因此同时提高了模型的准确性与可解释性。
发明内容
本发明的目的在于为具有图结构的数据及其之间的关系的应用场景中,提供一种高准确性与可解释性的群组发现方法。
本发明提供的群组发现方法,是基于数据增强和非负矩阵稀疏分解的,具体是利用循环神经网络从网络的拓扑结构和节点属性学习到不同属性的节点的邻居分布,抽取邻居模式;通过学习到的邻居模式恢复在数据采集过程中造成的拓扑信息缺失;并且,利用拉普拉斯平滑对节点属性进行修复,同时对拓扑结构与节点属性进行数据增强;然后,在非负矩阵分解中加入吉洪诺夫正则化(Tikhonov Regularization),使得矩阵能够被稀疏分解,从而使得每个节点远离了属于某个或者多个群组的划分边界,同时避免产生大量难以解释的非零小概率,提高模型的准确性与可解释性,其过程如图1所示,该具体步骤为:
(1)数据准备:给定一个网络(或称为图)G=(A,X),包含邻接矩阵A=(A1,…,An)T及其节点属性矩阵X=(X1,…,Xn)T,其中,A∈Rn×n,X∈Rn×r,n是节点数,r是节点属性的维数;
(2)拓扑结构数据增强:通过学习不同属性的节点的邻居分布,抽取邻居模式,来补充拓扑结构信息,具体流程为:
(2.1)学习邻居模式,即学习得到不同节点属性的网络节点的邻居分布,并得到不同邻居模式下的节点链接概率分布(流程如图2):首先,从图G中计算连通子图,并去除那些只有一个或者两个节点的连通分量gspa,得到连通子图集合g=(g0,g1,…,gm),根据均匀分布概率随机抽取一个连通子图g~p(g),然后通过随机选择起点,得到该连通子图的广度优先遍历序列π(g)~p(π),根据这个排序重排该连通子图,得到在该排序下的邻居矩阵Aπ(g)和节点属性矩阵Xπ(g),其中,fA和fN是对应的映射函数,即把子图映射到按某个广度优先遍历序列π(g)排序的邻接矩阵Aπ(g),以及按该广度优先遍历序列π(g)排序的节点属性矩阵Xπ(g)
每个节点的邻居模式用一个邻居节点属性向量表示,这个向量是通过自身节点属性以及其邻居的邻居节点属性向量的一些运算得到的,这些运算可以是线性的加和,也可以是非线性的取自身节点属性以及其邻居的邻居节点属性向量的列最大值,因此所有节点的邻居节点属性向量可以用一个邻居节点属性矩阵Hπ(g)表示,这个邻居节点属性向量可以用一个任意的有关每个节点的节点属性及其邻居的节点属性的函数farb(·)进行提取;由于是无向图,邻接矩阵可以进一步压缩,第i个节点的邻接向量可以用BFS(Breath-FirstSearch,广度优先搜索)序列表示,其对应的映射函数为fS,其中s=min{i,l},l是最大前向邻居数目:
假设每种邻居模式相互独立,把总的邻居模式概率转化成每个邻居模式的概率的乘积,用于下一步神经网络建模;拓扑结构数据增强步骤的学习模型可以用下式表示,其本质就是学习在不同邻居节点属性矩阵下的压缩后的邻接向量,也就是BFS序列的分布:
其中,
我们用两个循环神经网络学习该模型,第一个模型用来学习邻居节点属性矩阵Hπ(g),第二个模型用来学习不同邻居模式下的节点连接概率θπ~p(Sπ|Hπ),这两个循环神经网络分别用finh和fcon表示:
Hπ=finh(Xπ) (6)
θπ=fcon(Hπ) (7)
其中,连接概率θπ∈[0,1]n×s,n是节点数量,s=min{i,l},l是最大前向邻居数目;
(2.2)拓扑结构生成:对每个连通子图抽取得到对应的广度优先遍历序列π0(g0),…,πm(gm),以及稀疏子图的节点的随机排序πs(nspa),把这些排序进行连接,得到原图的总排序π(G);通过训练好的神经网络finh和fcon得到原图的邻居模式Hπ(G)和对应邻居模式下的节点连接概率θπ(G)
Hπ(G)=finh(Xπ(G)) (8)
θπ(G)=fcon(Hπ(G)) (9)
根据节点连接概率θπ(G),采样生成边,得到生成的BFS序列Sπ(G)~θπ(G),根据以下更新规则,得到数据增强后的邻接矩阵Aπ(G):
(3)节点属性数据增强:通过对每个节点属性与其邻居求和,即拉普拉斯平滑来增强节点属性数据,其中D∈Rn×n是度矩阵,I∈Rn×n是单位矩阵,t是平滑次数:
(4)非负矩阵的稀疏分解:首先,设定分解的目标函数,同时对邻接矩阵A和节点属性矩阵X进行非负矩阵分解,A分解为从属群组概率矩阵U与其转置矩阵UT的点积,其中U∈Rn ×c,c是群组数量,Uij代表第i个节点属于第j个群组的概率;X分解为从属群组概率矩阵U与群组潜在属性矩阵C的点积,其中C∈Rc×r,r是节点属性的数量;对于矩阵U和C同时加入吉洪诺夫正则化,目标函数如下:
其中,α,β是权重,取值为大于0,例如通常为0<α,β≤2,具体根据实际情况确定;运用交替最小二乘(Alternating Least Squares,ALS),可以同时对邻接矩阵A和节点属性矩阵X进行非负矩阵分解,得到矩阵U和C,其更新法则如下:
(5)推测所属群组:根据每个节点允许从属单个还是多个群组,可以进行非重叠的群组发现和重叠的群组发现:
(5.1)非重叠的群组发现:对于从属群组概率矩阵U,得到第i个节点所属的群组Communityi=argmax(Ui);
(5.2)重叠的群组发现:对于从属群组概率矩阵U,得到第i个节点所属的群组集合Communityi=find(Ui≥thres),其中,thres是设定的阈值,用于剔除数据噪声的影响(虽然稀疏分解使得结果0值变多了,但是依旧不能认为非0值就代表此节点属于某个群组,因为还是会有一些噪声影响,因此要设置阈值),通常取0.1,find(condition)表示找出符合条件condition的值的下标的函数。
本发明方法可以通过学习邻居模式和拉普拉斯平滑修复数据采集中造成的缺失以增强数据,同时在群组发现算法中加入吉洪诺夫正则化,对矩阵进行了稀疏分解,提高了群组发现模型的准确性、稳定性和可解释性。
附图说明
图1为基于数据增强和非负矩阵稀疏分解的群组发现方法图示。
图2为邻居模式学习的流程图示。
图3为由三个节点构成的一个样例网络图示。
具体实施方式
下面将给出基于数据增强和非负矩阵分解的群组发现方法的具体实施方式。
(1)数据准备:选取一个来源于加州大学圣克鲁兹分校公开的网站数据集Cornell(https://linqs-data.soe.ucsc.edu/public/lbc/WebKB.tgz),数据集中包含邻接矩阵A和节点属性矩阵X。数据集给出了节点对应的群组(课程、教务、学生、工程和职员群组),邻接矩阵A代表这五种群组之间的链接关系。节点属性矩阵X代表网站的属性,这里用0-1取值的词向量表示,比如字典共1703个单词,排序为:“homework”,“student”,“submit”,…,如果网站中出现了字典中的单词就在对应位置用1表示,反之,用0表示。比如某个网站出现了“homework”,“student”,但是没有其他单词,则表示为[1,1,0,…]。
(2)拓扑结构数据增强:首先从图G中计算连通子图,为便于描述,选取其中三个点构成的网络(如图3),此图邻接矩阵为[[0,1,0],[1,0,0],[0,0,0]]T,则其有两个连通分量,这两个连通分量的邻接矩阵可以表示为[[0,1,0],[1,0,0]]T和[[0,0,0]]T,去除那些只有一个或者两个节点的连通分量gspa,为举例方便,这里仅删除一个节点的连通分量,即邻接矩阵为[[0,0,0]]T的分量,得到连通子图集合g=(g0,g1,…,gm),其邻接矩阵的集合可以表示为{[[0,1,0],[1,0,0]]T},根据均匀分布概率随机抽取一个连通子图g~p(g),可以抽取出邻接矩阵为[[0,1,0],[1,0,0]]T的子图,然后通过随机选择起点,得到该连通子图的广度优先遍历序列π(g)~p(π),根据这个排序重排该连通子图,得到在该排序下的邻居矩阵Aπ(g)和节点属性矩阵Xπ(g)(方便起见,下面用A和X代替Aπ(g)和Xπ(g))。神经网络输入为邻接矩阵A和节点属性矩阵X,首先对邻接矩阵A进行压缩,比如邻接矩阵为[[0,1,0],[1,0,0]]T,则压缩为BFS序列后为[[1,1],[1,1]]T。然后通过循环神经网络finh提取邻居模式,比如节点属性矩阵X(如图3)属性为1703维[[1,0,0,…],[1,1,0,…],[0,0,1,…]]T,此时的循环神经网络finh的权重向量是[0.1,0.2,0.3,…]和[1,2],则邻居模式矩阵H为[2×[0.1×1,0.2×0,0.3×0,…],1×[0.1×1,0.2×0,0.3×0,…]+2×[0.1×1,0.2×1,0.3×0,…],1×(1×[0.1×1,0.2×0,0.3×0,…]+2×[0.1×1,0.2×1,0.3×0,…])+2×[0.1×0,0.2×1,0.3×0,…]]T=[[0.2,0,0,…],[0.6,0.4,0,…],[0.6,0.6,0,…]]T。之后通过循环神经网络fcon计算节点连接概率,比如此时的之后通过循环神经网络fcon权重为[0.4,0.5,0.6,…],则输出的连接概率是[0.4×0.2+0.5×0+0.6×0+…,0.4×0.6+0.5×0.4+0.6×0+…,0.4×0.6+0.5×0.6+0.6×0+…]T=[0.08,0.44,0.54]T。然后通过连接概率与真实值计算出损失值为1×In(0.08)+1×In(0.44)+0×In(0.54)=-3.3467,通过梯度下降更新循环神经网络finh和fcon的参数。生成图的过程和计算与训练时类似,只不过输入节点数不同,顺序不同,不在此赘述。假设生成的图的邻接矩阵为[[0,1,0],[1,0,1],[0,1,0]]T,原图为[[0,1,0],[1,0,0],[0,0,0]]T,根据更新算法,得到数据增强后的图的邻接矩阵A为[[0,1,0],[1,0,0],[0,0,0]]T+[[0,0,0],[0,0,1],[0,1,0]]T=[[0,1,0],[1,0,1],[0,1,0]]T
(3)节点属性数据增强:输入为增强后的邻接矩阵A和节点属性矩阵X,首先计算出度矩阵D,比如邻接矩阵A为[[0,1,0],[1,0,1],[0,1,0]]T,则度矩阵D为[[0+1+0,0,0],[0,1+0+1,0],[0,0,0+1+0]]T=[[1,0,0],[0,2,0],[0,0,1]]T。计算标准化后的邻接矩阵 假设平滑次数t取1,节点属性矩阵X为[[1,0,0,…],[1,1,0,…],[0,0,1,…]]T,平滑后,也就是数据增强后的节点属性 计算可得增强后的节点属性矩阵X为:
[[1.7071,0.7071,0,…],[1.2071,0.5,0.7071,…],[0.7071,0.7071,1,…]]T
(4)非负矩阵的稀疏分解:首先,设置群组数量c为5,随机初始化U与C,得到比如:
根据公式(13)、(14),设置α=1,β=0.5迭代计算后,得到更新后的U和C矩阵,如下:
(5)推测所属群组:如果是非重叠的群组发现,根据Communityi=argmax(Ui),其每行的最大值分别为0.2533、0.2855、0.2517,其对应的下标是0、2、2,因此可以得到节点对应从属的群组为[0,2,2]T,说明第1个、第2个、第3个节点分别属于第0种、第2种、第2种群组。如果是重叠的群组发现,根据Communityi=find(Ui≥0.1),可以求出从属的群组为[[0,2,3],[2,4],[1,2,4]]T,说明第1个节点同时属于第0种、第2种、第3种群组;第2个节点同时属于第2种、第4种群组;第3个节点同时属于第1种、第2种、第4种群组。
通过本发明方法,对于数据采集过程中造成的损失进行了修复,同时引入加上了吉洪诺夫正则化的非负矩阵分解,对于群组发现任务进行了有效的建模,使得每个节点远离了属于某个或者多个群组的划分边界,同时避免了产生许多难以解释的非零小概率,在提高了模型的准确性的同时提高了模型的可解释性,本方法相较于传统方法准确率提高了近10%-25%。

Claims (2)

1.一种基于数据增强和非负矩阵稀疏分解的群组发现方法,包括:利用循环神经网络从网络的拓扑结构和节点属性学习到不同属性的节点的邻居分布,抽取邻居模式;通过学习到的邻居模式恢复在数据采集过程中造成的拓扑信息缺失;利用拉普拉斯平滑对节点属性进行修复,同时对拓扑结构与节点属性进行数据增强;然后,在非负矩阵分解中加入吉洪诺夫正则化,使得矩阵能够被稀疏分解,从而得每个节点远离属于某个或者多个群组的划分边界,避免产生大量难以解释的非零小概率,具体步骤为:
(1)数据准备:给定一网络或称为图:G=(A,X),包含邻接矩阵A=(A1,…,An)T及其节点属性矩阵X=(X1,…,Xn)T,A∈Rn×n,X∈Rn×r,n是节点数,r是节点属性的维数;
(3)节点属性数据增强:通过对每个节点属性与其邻居求和,即拉普拉斯平滑来增强节点属性数据:
其中,D∈Rn×n是度矩阵,I∈Rn×n是单位矩阵,t是平滑次数;
(4)非负矩阵的稀疏分解:首先,设定分解的目标函数,同时对邻接矩阵A和节点属性矩阵X进行非负矩阵分解,其中,A分解为从属群组概率矩阵U与其转置矩阵UT的点积,U∈Rn×c,c是群组数量,Uij代表第i个节点属于第j个群组的概率;X分解为从属群组概率矩阵U与群组潜在属性矩阵C的点积,C∈Rc×r,r是节点属性的数量;对于矩阵U和C同时加入吉洪诺夫正则化,目标函数如下:
其中,α,β是权重,取值为大于0;运用交替最小二乘,可以同时对邻接矩阵A和节点属性矩阵X进行非负矩阵分解,得到矩阵U和C,其更新法则如下:
(5)推测所属群组:根据每个节点允许从属单个还是多个群组,进行非重叠的群组发现和重叠的群组发现:
(5.1)非重叠的群组发现:对于从属群组概率矩阵U,得到第i个节点所属的群组Communityi=argmax(Ui);
(5.2)重叠的群组发现:对于从属群组概率矩阵U,得到第i个节点所属的群组集合Communityi=find(Ui≥thres),其中,thres是设定的阈值,用于剔除数据噪声的影响,find(condition)表示找出符合条件condition的值的下标的函数。
2.根据权利要求1所述的基于数据增强和非负矩阵稀疏分解的群组发现方法,其特征在于,步骤(2)中所述拓扑结构数据增强的具体流程为:
(2.1)学习邻居模式,即学习得到不同节点属性的网络节点的邻居分布,并得到不同邻居模式下的节点链接概率分布:首先,从图G中计算连通子图,并去除那些只有一个或者两个节点的连通分量gspa,得到连通子图集合g=(g0,g1,…,gm),根据均匀分布概率随机抽取一个连通子图g~p(g);然后,通过随机选择起点,得到该连通子图的广度优先遍历序列π(g)~p(π),根据这个排序重排该连通子图,得到在该排序下的邻居矩阵Aπ(g)和节点属性矩阵Xπ(g),其中,设fA和fN是对应的映射函数,即把子图映射到按某个广度优先遍历序列π(g)排序的邻接矩阵Aπ(g),以及按该广度优先遍历序列π(g)排序的节点属性矩阵Xπ(g)
每个节点的邻居模式用一个邻居节点属性向量表示,这个向量是通过自身节点属性以及其邻居的邻居节点属性向量的一些运算得到,所述运算是线性的加和,或者是非线性的取自身节点属性以及其邻居的邻居节点属性向量的列最大值;所有节点的邻居节点属性向量用一个邻居节点属性矩阵Hπ(g)表示,这个邻居节点属性向量可以用一个任意的有关每个节点的节点属性及其邻居的节点属性的函数farb(·)进行提取;由于是无向图,将邻接矩阵进一步压缩,第i个节点的邻接向量用BFS序列表示,其对应的映射函数为fs,其中s=min{i,l},l是最大前向邻居数目:
假设每种邻居模式相互独立,把总的邻居模式概率转化成每个邻居模式的概率的乘积,用于下一步神经网络建模;拓扑结构数据增强步骤的学习模型用下式表示,其本质就是学习在不同邻居节点属性矩阵下的压缩后的邻接向量,也就是BFS序列的分布:
其中,
用两个循环神经网络学习该模型,第一个模型用来学习邻居节点属性矩阵Hπ(g),第二个模型用来学习不同邻居模式下的节点连接概率θπ~p(Sπ|Hπ),这两个循环神经网络分别用finh和fcon表示:
Hπ=finh(Xπ)
θπ=fcon(Hπ)
其中,连接概率θπ∈[0,1]n×s,n是节点数量,s=min{i,l},l是最大前向邻居数目;
(2.2)拓扑结构生成:对每个连通子图抽取得到对应的广度优先遍历序列π0(g0),…,πm(gm),以及稀疏子图的节点的随机排序πs(nspa),把这些排序进行连接,得到原图的总排序π(G);通过训练好的神经网络finh和fcon得到原图的邻居模式Hπ(G)和对应邻居模式下的节点连接概率θπ(G)
Hπ(G)=finh(Xπ(G))
θπ(G)=fcon(Hπ(G))
根据节点连接概率θπ(G),采样生成边,得到生成的BFS序列Sπ(G)~θπ(G),根据以下更新规则,得到数据增强后的邻接矩阵Aπ(G):
CN201910277684.2A 2019-04-08 2019-04-08 一种基于数据增强和非负矩阵稀疏分解的群组发现方法 Pending CN110136017A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910277684.2A CN110136017A (zh) 2019-04-08 2019-04-08 一种基于数据增强和非负矩阵稀疏分解的群组发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277684.2A CN110136017A (zh) 2019-04-08 2019-04-08 一种基于数据增强和非负矩阵稀疏分解的群组发现方法

Publications (1)

Publication Number Publication Date
CN110136017A true CN110136017A (zh) 2019-08-16

Family

ID=67569512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910277684.2A Pending CN110136017A (zh) 2019-04-08 2019-04-08 一种基于数据增强和非负矩阵稀疏分解的群组发现方法

Country Status (1)

Country Link
CN (1) CN110136017A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110957002A (zh) * 2019-12-17 2020-04-03 电子科技大学 一种基于协同矩阵分解的药物靶点相互作用关系预测方法
CN113407790A (zh) * 2021-08-19 2021-09-17 成都冰鉴信息科技有限公司 数据修复方法、装置及数据处理设备
CN117421492A (zh) * 2023-12-19 2024-01-19 四川久远银海软件股份有限公司 一种数据要素商品的筛选系统及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110957002A (zh) * 2019-12-17 2020-04-03 电子科技大学 一种基于协同矩阵分解的药物靶点相互作用关系预测方法
CN110957002B (zh) * 2019-12-17 2023-04-28 电子科技大学 一种基于协同矩阵分解的药物靶点相互作用关系预测方法
CN113407790A (zh) * 2021-08-19 2021-09-17 成都冰鉴信息科技有限公司 数据修复方法、装置及数据处理设备
CN117421492A (zh) * 2023-12-19 2024-01-19 四川久远银海软件股份有限公司 一种数据要素商品的筛选系统及方法
CN117421492B (zh) * 2023-12-19 2024-04-05 四川久远银海软件股份有限公司 一种数据要素商品的筛选系统及方法

Similar Documents

Publication Publication Date Title
Shen et al. Meal: Multi-model ensemble via adversarial learning
Young et al. Optimizing deep learning hyper-parameters through an evolutionary algorithm
Yuan et al. A method for estimating the number of hidden neurons in feed-forward neural networks based on information entropy
CN109948000B (zh) 异质网络的异常目标检测方法、装置、设备及存储介质
CN108520275A (zh) 一种基于邻接矩阵的连接信息规整系统、图特征提取系统、图分类系统和方法
CN110232434A (zh) 一种基于属性图优化的神经网络架构评估方法
CN110136017A (zh) 一种基于数据增强和非负矩阵稀疏分解的群组发现方法
Olteanu et al. On-line relational and multiple relational SOM
CN111445963B (zh) 一种基于图节点信息聚合的子图同构约束求解方法
CN111428848B (zh) 基于自编码器和3阶图卷积的分子智能设计方法
CN106529721A (zh) 一种深度特征提取的广告点击率预测系统及其预测方法
CN112381179A (zh) 一种基于双层注意力机制的异质图分类方法
CN113190654A (zh) 一种基于实体联合嵌入和概率模型的知识图谱补全方法
CN110263236A (zh) 基于动态多视图学习模型的社交网络用户多标签分类方法
CN111783879B (zh) 基于正交注意力机制的层次化压缩图匹配方法及系统
Goodarzi et al. Incorporating sparse model machine learning in designing cultural heritage landscapes
CN113989544A (zh) 一种基于深度图卷积网络的群体发现方法
CN113434782A (zh) 基于联合嵌入学习模型的跨社交网络用户身份识别方法
CN112905906A (zh) 一种融合局部协同与特征交叉的推荐方法及系统
CN112163106A (zh) 二阶相似感知的图像哈希码提取模型建立方法及其应用
Zhao et al. Fuzzy analysis for overlapping community structure of complex network
CN107944045B (zh) 基于t分布哈希的图像检索方法及系统
CN115588487A (zh) 一种基于联邦学习和生成对抗网络的医学图像数据集制作方法
CN113361928B (zh) 一种基于异构图注意力网络的众包任务推荐方法
CN115081516A (zh) 一种基于生物连接组时变卷积网络的物联网流量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190816

RJ01 Rejection of invention patent application after publication