CN103559320B - 对异质网络中对象进行排序的方法 - Google Patents

对异质网络中对象进行排序的方法 Download PDF

Info

Publication number
CN103559320B
CN103559320B CN201310596279.XA CN201310596279A CN103559320B CN 103559320 B CN103559320 B CN 103559320B CN 201310596279 A CN201310596279 A CN 201310596279A CN 103559320 B CN103559320 B CN 103559320B
Authority
CN
China
Prior art keywords
type
path
target type
tensor
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310596279.XA
Other languages
English (en)
Other versions
CN103559320A (zh
Inventor
石川
李依桐
吴斌
王柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Haizhi Xingtu Technology Co ltd
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201310596279.XA priority Critical patent/CN103559320B/zh
Publication of CN103559320A publication Critical patent/CN103559320A/zh
Application granted granted Critical
Publication of CN103559320B publication Critical patent/CN103559320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种对异质网络中对象进行排序的方法,其特征在于,所述方法包括:获取第一目标类型与第二目标类型;将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络;将所述二分网络转化为对应的张量X;获取在所述张量X中进行随机游走时的可达概率平稳分布;根据所述可达概率平稳分布对所述第一目标类型中的对象、所述第二目标类型中的对象及所述第一目标类型与所述第二目标类型之间的路径进行排序。与现有技术相比,本实施例对异质网络中的对象进行排序时,不但可以使用路径捕捉语义信息,而且可以充分利用语义信息,排序结果相对准确。

Description

对异质网络中对象进行排序的方法
技术领域
本发明涉及信息技术领域,尤其涉及对异质网络中对象进行排序的方法。
背景技术
信息网络是指由对象与对象之间的链接组成的网络。信息网络一般可以分成同质信息网络和异质信息网络。其中,同质信息网络是指由同一类型的对象及对象之间的链接组成的网络,异质信息网络指的是由不同类型的对象及对象之间的链接组成的网络,同质信息网络又被简称为同质网络,异质信息网络又被简称为异质网络。在异质网络中,不同的对象可以属于不同的类型,不同对象之间的链接也可以表示不同的关系。异质网络不但普遍存在,而且已经成为现代信息基础体系的不可缺少的一部分。例如,文献网络即为一类常见的异质网络。在文献网络中,类型包括作者,论文,会议,关键词等;对象之间的链接可以表示作者之间的合作关系、作者与论文间的写作关系、论文与会议间的发布关系、论文与论文间的引用关系等不同的关系。
随着搜索引擎技术的发展,用户的搜索需求也越来越多样化。用户在对某信息网络所包含的信息进行检索时,不但希望检索结果准确,而且通常希望检索结果能够按照重要性进行呈现。例如,人们检索某个作者的论文时,不但希望检索到该作者的所有论文,而且通常希望该作者的所有论文能够按照其重要性排序后再进行显示。因此,按照对象的重要性对异质网络中的同一类型的对象进行排序就成为一项重要的任务。
现有技术中,对异质网络中某一特定类型的对象进行排序时,通常将异质网络中所有的对象抽象为同一类型的对象,将异质网络转化为同质网络;然后对同质网络中的所有对象进行排序得到混合排序结果;再从混合排序结果中获取某一特定类型中的对象的排序结果。例如,对文献网络内的对象进行排序时,通常将作者,论文,会议,关键词等不同类型的对象都视为同样的节点,将作者之间的合作关系、作者与论文间的写作关系等不同的关系都视为同样的链接;在此基础上,将文献网络转化为由节点和节点间的链接构成的同质网络;基于该同质网络,对所有的节点进行排序,得到混合排序结果;最后从混合排序结果中,获取特定类型对象的排序结果。
在实际的异质网络中,某对象的重要性通常会影响到与其存在链接的对象的重要性。例如,会议的重要性会影响到在该会议上发布的论文的重要性。不同类型的对象通常具有不同的影响力权重。例如,关键词的影响力权重通常低于作者的影响力权重。不同对象的对象类型通过语义信息进行表示,因此不同类型的对象的影响力权重也需要通过语义信息进行表示。将不同类型的对象都视为同样的节点,会丢失语义信息,从而丢失对象的影响力权重,使得混合排序结果会明显地偏向于具有较多链接的对象。从上述内容可以看出,基于同质网络对异质网络包含的对象进行排序,会造成异质网络所包含的对象类型、关系类型等语义信息大量丢失,使得排序结果不准确。
发明内容
本发明实施例提供了对异质网络中对象排序的方法,以解决现有技术基于同质网络对异质网络包含的对象进行排序,会造成异质网络所包含的语义信息大量丢失,使得排序结果不准确的问题。
一方面,本发明提供了一种对异质网络中对象进行排序的方法,所述方法包括:获取第一目标类型与第二目标类型;将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络;将所述二分网络转化为对应的张量X;获取在所述张量X中进行随机游走时的可达概率平稳分布;根据所述可达概率平稳分布对所述第一目标类型中的对象、所述第二目标类型中的对象及所述第一目标类型与所述第二目标类型之间的路径进行排序。
结合一方面,在第一种可能的实现方式中,所述将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络包括:获取所述第一目标类型与所述第二目标类型之间的约束路径;生成由所述第一目标类型、所述第二目标类型及所述约束路径构成的二分网络。
结合一方面,在第二种可能的实现方式中,所述将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络包括:获取所述第一目标类型与所述第二目标类型之间的元路径;生成由所述第一目标类型、所述第二目标类型及所有所述元路径构成的二分网络。
结合一方面、第一种可能的实现方式、第二种可能的实现方式,在第三种可能的实现方式中,所述获取在所述张量X中进行随机游走时的可达概率平稳分布包括:获取F、R和T,所述F是X沿着列向量方向上的正规化张量,所述R是X沿着管向量方向上的正规化张量,所述T是X沿着行向量方向上的正规化张量;根据所述F、R和T计算出在张量X中进行随机游走时,所述第一目标类型的可达概率平稳分布,所述路径的可达概率平稳分布及所述第二目标类型的可达概率平稳分布。
从上述实施例可以看出,获取第一目标类型与第二目标类型;将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络;将所述二分网络转化为对应的张量X;获取在张量X中进行随机游走时的可达概率平稳分布;根据所述可达概率平稳分布对所述第一目标类型中的对象、所述第二目标类型中的对象及所述第一目标类型与所述第二目标类型之间的路径进行排序。与现有技术相比,本实施例对异质网络中的对象进行排序时,不但可以使用路径捕捉语义信息,而且可以充分利用语义信息,排序结果相对准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本发明的主旨。
图1为本发明对异质网络中对象进行排序的方法一个实施例的流程图;
图2为科技文献信息网的网络模式示意图;
图3为一个二分网络的示意图;
图4为一个三维数组示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,为本发明对异质网络中对象进行排序的方法一个实施例的流程图,该方法包括如下步骤:
步骤101,获取第一目标类型与第二目标类型。
信息网络通常可以用图(graph)来表示。给定一个模式S=(A,R),由实体集A={A}和关系集R={R}组成。一个信息网络可以转化为一个有向图G=(V,E),其中对象类型的映射函数为关系类型的映射函数为ψ:E→R。每个对象v∈V属于某一特定的类型每条边e∈E属于某一特定的关系类型ψ(e)∈R。当对象的种类|A|>1或关系的种类|R|>1时,此网络被称作异质网络;否则就称为同质网络。
由异质网络的定义可知,异质网络包含两种以上的类型,其中每种类型可以包括多个对象。对异质网络中的对象进行排序时,通常需要得到的是其中某一个特定对象类型中的对象进行排序的结果。因此在进行排序时,可以将所述特定类型作为第一目标类型,然后从该异质网络包含的类型中再选出一个作为第二目标类型,该第二目标类型可以是与第一目标类型不同的类型,也可以是与第一目标类型相同的类型。
步骤102,将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络。
由于在异质网络中,有多种类型的对象及关系。如果关系类型R为从对象类型S到对象类型T的一个关系类型,则可以表示为S和T分别为R的源类型和目标类型,可以表示为R.S和R.T。R的逆R-1满足通常来说,除R为对称路径的情况外,R和R-1为不相同的关系。元路径P可以表示模式S=(A,R)上的路径,P可以表示为简写为A1A2…Al+1其中A1、A2、…、Al+1均为对象类型,R是类型A1和Al+1之间的一个复合关系,R=R1οR2ο…οRl,其中ο表示关系间的复合操作符,R1、R2、…、Rl均为关系类型。其中,当元路径的长度为1时,即,R=Rn,n=1,2,…,l时,元路径就退化为关系。
在获取到所述第一目标类型、所述第二目标类型之后,可以根据所述异质网络生成所述第一目标类型与所述第二目标类型之间的路径。其中所述路径可以为所有元路径,也可以为有约束的元路径,即约束路径。
元路径可以用于异质网中语义信息的描述。图2展现了一个科技文献信息网的网络模式,该网络模式描述了异质网中的对象类型及关系。与同质网不同,异质网中的对象可以通过不同的路径连接起来,而且这些路径具有不同的含义。例如在图2中,当第一目标类型与第二目标类型都为作者时,作者之间可以通过路径“作者-论文-作者”,即,路径APA进行连接,也可以通过“作者-论文-会议-论文-作者”,即路径APCPA连接。能够连接第一目标类型与第二目标类型的这些路径被称为元路径。明显地,不同的路径蕴含的语义信息不同。例如在图2展现的网络模式中,路径APA表示作者间的论文合作关系,而APCPA则表示作者们的论文发表在同一个会议上。因此,元路径可以作为一个有效方法,捕捉异质网语义信息。例如,在科技文献信息网中,可以利用元路径“作者-论文-作者”描述两个作者Philip S.Yu和Jiawei Han之间的合作关系。
为更充分的利用语义信息,可以对元路径设置约束条件,从所有元路径中选择符合约束条件的部分,得到有约束的元路径,即,约束路径。约束路径是基于某一特定条件约束的元路径,表示为CP=P|C。其中,P=(A1A2…Al)是一条元路径,C表示元路径中对对象的约束。其中,C表示对对象单一的或多样的约束条件。以图2所示的科技文献信息网为例,有约束的元路径APA|P.L="DM"通过把论文的类别限定为DM来表示数据挖掘领域中的作者合作关系。相似地,路径APCPA|C="CIKM"□P.L="DM"表示CIKM会议中数据挖掘领域论文的作者的合作关系。与元路径相比,有约束的元路径通过不同的约束条件对元路径进行细分,可以传递出更为丰富的语义信息。例如,在科技文献信息网中,可以利用元路径APA|P.L="DM"描述两个作者Philip S.Yu和Jiawei Han在数据挖掘领域中的合作关系。
在获取到所述第一目标类型、所述第二目标类型之后,并生成所述第一目标类型与所述第二目标类型之间的路径之后,所述第一目标类型、所述第二目标类型与所述路径可以构成一个二分网络。具体的生成过程在此就不再赘述。
步骤103,将所述二分网络转化为对应的张量X。
每一个二分网络都可以表示为张量形式,即,每一个二分网络都可以采用一个三维数组来表示。所述第一目标类型、所述第二目标类型及所述路径构成的二分网络可以用张量X表示。X=(xi,j,k)为一个3阶张量,其中xi,j,k表示第一目标类型中的对象i通过第j条约束路径与第二目标类型中对象k相联系的次数,xi,j,k∈R,i=1,…,m,j=1,…,l,k=1,…,n。
图3为一个二分网络的示意图。该二分网络包括第一目标类型A与第二目标类型B,其中,A包括3个对象:a1,a2,a3;B包括3个对象:b1,b2,b3。A与B之间存在3种关系:CP1,CP2,CP3,其中,a1与b1、a2与b3、a3与b2之间存在CP1关系;a1与b1、a2与b2、a2与b3、a3与b2之间存在CP2关系,其中a1与b1之间存在两条CP2关系;a1与b2、a2与b1、a3与b1、a3与b3之间存在CP3关系。这些关系由以A为源类型,以B为第二目标类型的3条约束路径生成。对象及对象间的关系,可以用张量形式表示,即用一个多维数组的形式表示。例如,图4是一个三维数组,其中每个二维平面可以表示在某一关系下的邻接矩阵。因此图3所示的二分网络可以被表示成图4所示的规模为3×3×3的三维张量。
步骤104,获取在所述张量X中进行随机游走时的可达概率平稳分布。
一个随机游走者在张量中游走,经过某个结点或某条路径的概率越大,该结点或路径的重要性就越高。因此可以在张量X上进行随机游走,并根据随机游走过程得到的可达概率平稳分布来对对象及路径的重要性进行排序。
具体来说,对于关系如果WAB是A与B在关系上的邻接矩阵,UAB是WAB在行向量方向上的正规化矩阵,UAB就是关系上的转移概率矩阵。
如果,WAB是A与B在关系上的邻接矩阵。如果在A上有一个约束C,有约束的关系R|C对应的有约束的转移概率矩阵为U'AB=MCUAB,其中MC为由对象A上的约束条件C生成的约束矩阵。约束矩阵MC通常是一个对角矩阵,矩阵的维数即A中包含的对象的个数。如果某个对象满足约束条件,对角阵中相应的元素为1,否则为0。同样地,我们也可以对B或者两者都限定约束条件。当约束矩阵MC等于单位阵I的时候,转移概率矩阵是一种特殊的有约束的转移概率矩阵。
给定网络模式为S=(A,R)的一个网络G=(V,E),对于一条元路径P=(A1A2…Al),基于所有路径的可达概率矩阵PM表示为 PM P = U A 1 A 2 U A 2 A 3 . . . U A 1 A l + 1 . PMP(i,j)表示在路径P下对象i∈A1到达对象j∈Al+1的概率。
相似地,对于一个约束路径CP=(A1A2…Al+1|C),其可达概率矩阵表示为 PM CP = U ′ A 1 A 2 U ′ A 2 A 3 . . . U ′ A 1 A l + 1 . PMCP(i,j)表示在路径P|C下对象i∈A1到达对象j∈Al+1的概率。
如果对关系中的对象没有约束,是相等的。如果有约束,那么可以只考虑那些满足约束的对象,利用可达概率矩阵和MP来表示基于有约束的元路径的可达概率矩阵。
由于二分网络能够表现为张量形式,在二分网络中,可以用转移概率张量来表示对象与关系间的转移概率。对于一个二分网络,可以用X表示该网络的张量,用F表示X沿着列向量方向上的正规化张量,用R表示X沿着管向量方向上的正规化张量,用T表示X沿着行向量方向上的正规化张量。F、R和T被称作转移概率张量,表示如下:
f i , j , k = x i , j , k Σ i = 1 m x i , j , k , 其中,i=1,2,…,m;i表示对象,m为第一目标类型中对象的数量;
r i , j , k = x i , j , k Σ j = 1 l x i , j , k , 其中,j=1,2,…,l;j表示关系,l为关系的数量;
t i , j , k = x i , j , k Σ k = 1 n x i , j , k , 其中,k=1,2,…,n;k表示对象,n为第二目标类型中对象的数量。
其中,fi,j,k表示从第一目标类型中的对象i通过关系j到达第二目标类型中的对象k的概率,ri,j,k表示通过关系j从对象i到达对象k的概率,ti,j,k表示当前对象i通过当前关系j到达对象k的概率。
这三个张量的含义可以形式化定义如下:
fi,j,k=Prob(Xt=i|Yt=j,Zt=k);
ri,j,k=Prob(Yt=j|Xt=i,Zt=k);
ti,j,k=Prob(Zt=k|Xt=i,Yt=j);
其中,Xt、Zt和Yt是3个随机变量,分别代表在t时刻访问到类型A或类型B中某一特定对象以及用到某一特定关系的概率。
对象及关系的可达概率平稳分布可以表示如下:
x=(x1,x2,…,xm)T
y=(y1,y2,…,yl)T
z=(z1,z2,…,zn)T
其中,
x i = lim t → ∞ Prob ( X t = i ) ;
y j = lim t → ∞ Prob ( Y t = j ) ;
z k = lim t → ∞ Prob ( Z t = k ) ;
根据上述公式,我们可以得到:
Prob ( X t = i ) = Σ j = 1 l Σ k = 1 n f i , j , k × Prob ( Y t = j , Z t = k ) ;
Prob ( Y t = j ) = Σ i = 1 m Σ k = 1 n r i , j , k × Prob ( X t = i , Z t = k ) ;
Prob ( Z t = k ) = Σ i = 1 m Σ j = 1 l t i , j , k × Prob ( X t = i , Y t = j ) ;
其中,Prob(Yt=j,Zt=k)是Yt和Zt的联合概率分布;Prob(Xt=i,Zt=k)是Xt和Zt的联合概率分布;Prob(Xt=i,Yt=j)是Xt和Yt的联合概率分布。
由于可以认为Xt、Yt和Zt是彼此独立的,为了得到xi、yj和zk,上述联合概率分布可以表示如下:
Prob(Xt=i,Yt=j)=Prob(Xt=i)Prob(Yt=j);
Prob(Xt=i,Zt=k)=Prob(Xt=i)Prob(Zt=k);
Prob(Yt=j,Zt=k)=Prob(Yt=j)Prob(Zt=k);
综上可得:
x i = Σ j = 1 l Σ k = 1 n f i , j , k y j z k , 其中,i=1,2,…,m;
y j = Σ i = 1 m Σ k = 1 n r i , j , k x i z k , 其中,j=1,2,…,l;
z k = Σ i = 1 m Σ j = 1 l t i , j , k x i y j , 其中,k=1,2,…,n;
上述公式可以转换成张量的形式,即:
x=Fyz;
y=Rxz;
z=Txy;
其中, Σ i = 1 m x i = 1 , Σ j = 1 l y j = 1 , Σ k = 1 n z k = 1 .
因此,可以采用公式xt=Fyt-1zt-1计算进行随机游走时,第一目标类型的可达概率平稳分布;可以采用公式yt=Rxtzt-1计算进行随机游走时,关系的可达概率平稳分布;可以采用公式zt=Txtyt计算进行随机游走时,第二目标类型的可达概率平稳分布。
在计算可达概率平稳分布时,首先生成3个初始概率分布x0、y0、z0并设置阈值ε。其中,x0可以根据第一目标类型中的对象数量计算得出,例如,可以赋予每一个待排序对象相等的初始概率,所有待排序对象的初始概率和为1;y0可以根据二分网络中关系的数量计算得出,例如,可以赋予每一个关系相等的初始概率,所有关系的初始概率和为1;z0可以根据第二目标类型中的对象数量计算得出,例如,可以赋予每一个目标对象相等的初始概率,所有目标对象的初始概率和为1;阈值ε的值可以根据需要进行设定,通常可以设置为10-8
然后从t=1开始重复以下计算过程:xt=Fyt-1zt-1;yt=Rxtzt-1;zt=Txtyt
当xt-xt-1+yt-yt-1+zt-zt-1<ε时,xt,yt,zt即为可达概率平稳分布,其中,xt为第一目标类型的可达概率平稳分布,yt为关系的可达概率平稳分布,zt为第二目标类型的可达概率平稳分布。
步骤105,根据所述可达概率平稳分布对所述第一目标类型中的对象、所述第二目标类型中的对象及所述第一目标类型与所述第二目标类型之间的路径进行排序。
由于xt为第一目标类型的可达概率平稳分布,yt为关系的可达概率平稳分布,zt为第二目标类型的可达概率平稳分布,xt中包含了在张量X中进行随机游走时,第一目标类型中所有对象的平稳概率;yt中包含了在张量X中进行随机游走时,所有关系的平稳概率;zt中包含了在张量X中进行随机游走时,第二目标类型中所有对象的平稳概率。由于平稳概率越大,在进行随机游走时该对象或关系被访问的可能性越大,即该对象或关系的重要性越高。因此可以根据平稳概率的大小来对对象或关系的重要性进行排序。
具体来说,可以根据xt对第一目标类型中的对象的重要性进行排序;根据yt对关系的重要性进行排序;根据zt对第二目标类型中的对象的重要性进行排序。
从上述实施例可以看出,获取第一目标类型与第二目标类型;将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络;将所述二分网络转化为对应的张量X;获取在张量X中进行随机游走时的可达概率平稳分布;根据所述可达概率平稳分布对所述第一目标类型中的对象、所述第二目标类型中的对象及所述第一目标类型与所述第二目标类型之间的路径进行排序。与现有技术相比,本实施例对异质网络中的对象进行排序时,不但使用了元路径捕捉到的语义信息,而且可以充分利用语义信息,使排序结果相对准确。另外,采用本实施例可以同时对两个不同类型的对象进行排序。除了能够对对象进行排序之外,本实施例还可以对对象之间的关系的重要性进行排序。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种对异质网络中对象进行排序的方法,其特征在于,所述方法包括:
获取第一目标类型与第二目标类型;
将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络;
将所述二分网络转化为对应的张量X;
获取在所述张量X中进行随机游走时的可达概率平稳分布;
根据所述可达概率平稳分布分别对所述第一目标类型中的对象、所述第二目标类型中的对象及所述第一目标类型与所述第二目标类型之间的路径进行排序。
2.如权利要求1所述的方法,其特征在于,所述将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络包括:
获取所述第一目标类型与所述第二目标类型之间的约束路径;
生成由所述第一目标类型、所述第二目标类型及所述约束路径构成的二分网络。
3.如权利要求1所述的方法,其特征在于,所述将异质网络转化为由所述第一目标类型、所述第二目标类型及所述第一目标类型与所述第二目标类型之间的路径构成的二分网络包括:
获取所述第一目标类型与所述第二目标类型之间的元路径;
生成由所述第一目标类型、所述第二目标类型及所有所述元路径构成的二分网络。
4.如权利要求1至3任意一项权利要求所述的方法,其特征在于,所述获取在所述张量X中进行随机游走时的可达概率平稳分布包括:
获取F、R和T,所述F是X沿着列向量方向上的正规化张量,所述R是X沿着管向量方向上的正规化张量,所述T是X沿着行向量方向上的正规化张量;
根据所述F、R和T计算出在张量X中进行随机游走时,所述第一目标类型的可达概率平稳分布,所述路径的可达概率平稳分布及所述第二目标类型的可达概率平稳分布。
CN201310596279.XA 2013-11-21 2013-11-21 对异质网络中对象进行排序的方法 Active CN103559320B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310596279.XA CN103559320B (zh) 2013-11-21 2013-11-21 对异质网络中对象进行排序的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310596279.XA CN103559320B (zh) 2013-11-21 2013-11-21 对异质网络中对象进行排序的方法

Publications (2)

Publication Number Publication Date
CN103559320A CN103559320A (zh) 2014-02-05
CN103559320B true CN103559320B (zh) 2016-08-24

Family

ID=50013566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310596279.XA Active CN103559320B (zh) 2013-11-21 2013-11-21 对异质网络中对象进行排序的方法

Country Status (1)

Country Link
CN (1) CN103559320B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304496A (zh) * 2018-01-11 2018-07-20 上海交通大学 异构信息网中基于组合元路径的节点相似关系检测方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10264048B2 (en) 2016-02-23 2019-04-16 Microsoft Technology Licensing, Llc Graph framework using heterogeneous social networks
CN105913125B (zh) * 2016-04-12 2018-05-25 北京邮电大学 异质信息网络元路径确定、链路预测方法及装置
CN108829703A (zh) * 2018-04-28 2018-11-16 尚谷科技(天津)有限公司 一种基于多源树图结构的遥感海拔数据的处理方法
CN109902203B (zh) * 2019-01-25 2021-06-01 北京邮电大学 基于边的随机游走的网络表示学习方法和装置
CN110334134B (zh) * 2019-07-17 2022-05-13 中国人民解放军国防科技大学 基于元路径的异质信息网络能力节点重要度评估方法
CN110609889B (zh) * 2019-08-30 2021-11-23 中国科学院计算技术研究所 基于学术网络确定对象重要性排名及选择评审专家的方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001041039A2 (en) * 1999-12-02 2001-06-07 Secure Computing Corporation Security management system in an heterogenous network environment
CN102890703A (zh) * 2012-07-20 2013-01-23 浙江工业大学 一种网络异质多维标度方法
CN103020116A (zh) * 2012-11-13 2013-04-03 中国科学院自动化研究所 在社交媒体网络上自动筛选有影响力用户的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001041039A2 (en) * 1999-12-02 2001-06-07 Secure Computing Corporation Security management system in an heterogenous network environment
CN102890703A (zh) * 2012-07-20 2013-01-23 浙江工业大学 一种网络异质多维标度方法
CN103020116A (zh) * 2012-11-13 2013-04-03 中国科学院自动化研究所 在社交媒体网络上自动筛选有影响力用户的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304496A (zh) * 2018-01-11 2018-07-20 上海交通大学 异构信息网中基于组合元路径的节点相似关系检测方法

Also Published As

Publication number Publication date
CN103559320A (zh) 2014-02-05

Similar Documents

Publication Publication Date Title
CN103559320B (zh) 对异质网络中对象进行排序的方法
Lin et al. Mining of skyline patterns by considering both frequent and utility constraints
Sheng et al. Identifying influential nodes in complex networks based on global and local structure
Sun et al. Mining heterogeneous information networks: principles and methodologies
US9311731B2 (en) Dynamic graph system for a semantic database
Simonsen et al. Diffusion on complex networks: a way to probe their large-scale topological structures
CN108920527A (zh) 一种基于知识图谱的个性化推荐方法
CN104424254B (zh) 获取相似对象集合、提供相似对象信息的方法及装置
Shet et al. A new similarity measure for taxonomy based on edge counting
CN107391659A (zh) 一种基于信誉度的引文网络学术影响力评价排序方法
Xu et al. Deep rényi entropy graph kernel
Liu et al. A multi-objective model for discovering high-quality knowledge based on data quality and prior knowledge
CN103559318B (zh) 对异质信息网络包含的对象进行排序的方法
Pasinato et al. Generating synthetic data for context-aware recommender systems
Jiang et al. An efficient community detection algorithm using greedy surprise maximization
Dinh et al. A survey of privacy preserving utility mining
CN108428044A (zh) 一种基于网络图的员工重要性排序方法
CN104462480A (zh) 基于典型性的评论大数据挖掘方法
CN108280176A (zh) 基于MapReduce的数据挖掘优化方法
Klemm et al. Rugged and elementary landscapes
Antoniou et al. Context-similarity based hotlinks assignment: Model, metrics and algorithm
Zheng et al. Ranking the importance of nodes of complex networks by the equivalence classes approach
CN102750331B (zh) 数字文献资源协同阅览系统
Ma et al. Personalized geo-social group queries in location-based social networks
Sabetghadam et al. Which One to Choose: Random Walks or Spreading Activation?

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220906

Address after: Gate 8, Block B, 768 Creative Industry Park, No. 5 Xueyuan Road, Haidian District, Beijing 100081

Patentee after: BEIJING HAIZHI XINGTU TECHNOLOGY Co.,Ltd.

Address before: 100876 Beijing city Haidian District Xitucheng Road No. 10

Patentee before: Beijing University of Posts and Telecommunications