CN115329189A - 基于层次图属性网络表示学习的论文推荐方法及系统 - Google Patents

基于层次图属性网络表示学习的论文推荐方法及系统 Download PDF

Info

Publication number
CN115329189A
CN115329189A CN202210811231.5A CN202210811231A CN115329189A CN 115329189 A CN115329189 A CN 115329189A CN 202210811231 A CN202210811231 A CN 202210811231A CN 115329189 A CN115329189 A CN 115329189A
Authority
CN
China
Prior art keywords
paper
network
node
thesis
representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210811231.5A
Other languages
English (en)
Inventor
周明强
韩奇志
李梦娇
张程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202210811231.5A priority Critical patent/CN115329189A/zh
Publication of CN115329189A publication Critical patent/CN115329189A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了基于层次图属性网络表示学习的论文推荐方法及系统,方法包括:基于论文库构建论文网络;基于所述论文网络,通过边合并、结构等效性合并、社区合并和属性合并,构建层次图;对所述层次图进行层内网络表示学习以及层间网络表示学习,生成论文节点嵌入表示,所述层间网络表示学习先执行正向初始化,再执行反向初始化的层间网络表示学习;基于所述论文节点嵌入表示,所述通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表,并将所述论文推荐列表中的论文推荐给用户。本发明采用基于层次图属性网络表示学习的论文推荐方法,从而从根源上解决了现有的基于网络表示学习方法的论文推荐准确率低的问题。

Description

基于层次图属性网络表示学习的论文推荐方法及系统
技术领域
本发明属于个性化推荐领域,具体涉及一种基于层次图属性网络表示学习的论文推荐方法及系统。
背景技术
随着互联网的高速发展以及知识的快速更新,网络上发表的科研论文发表数量爆炸式增长,科研信息过载使得研究人员需要花费大量的时间和精力查找其所需要的论文信息。间接造成了科研浪费。论文推荐准确的将论文推荐给研究人员,正成为科研工作不可或缺的部分。与论文推荐相关的算法大多基于网络表示学习。基于网络表示学习的论文推荐算法通常将论文数据库中的论文抽象为节点,论文之间的引用关系抽象为边,论文的题目,摘要,关键词,作者,机构,发表时间等抽象为节点的属性信息,在通过网络表示学习方法将网络中的节点表示为低维嵌入表示,并用于论文的推荐。
然而,目前大多数关于网络表示学习的研究都是基于网络结构,例如利用网络节点生成的游走序列、一阶邻近性、二阶邻近性、高阶邻近性等网络结构进行网络表示学习并取得了一定的成功,但这类方法未考虑论文节点的属性信息,难以准确的推荐论文。同时,论文数据库生成的论文网络中拥有大量的结构数据,此外网络还包含各种类型的异构的属性信息,数据量大同时网络结构疏密迥异,邻接信息差异巨大,如何在网络表示中集成拓扑结构和属性信息的同时平衡两者的关系,获取网络中每个论文节点的嵌入表示来进行论文的推荐是十分困难的。
因此,如何提高论文推荐准确性以及提升用户满意度,是本领域亟待解决的问题。
发明内容
本发明的目的是针对现有技术的缺陷,提供一种基于层次图属性网络表示学习的论文推荐方法及系统。本发明基于层次图属性网络表示学习的论文推荐方法,根据论文库构建论文网络,基于所述论文网络,通过结构合并和属性合并,构建层次图,对所述层次图进行层内网络表示学习和层间网络表示学习,生成节点嵌入表示,通过计算论文节点间的嵌入表示的相似度来生成推荐列表,并将所述推荐列表中的论文推荐给用户,从而从根源上解决了现有的基于网络表示学习方法的论文推荐准确性低、用户满意度低的问题。
为了实现以上目的,本发明采用以下技术方案:
一种基于层次图属性网络表示学习的论文推荐方法,其特征在于,包括步骤:
S1、基于论文库构建论文网络,其中,所述论文网络中的节点表示论文,边表示论文间的引用关系,节点的属性信息为论文的信息,所述论文的信息包括:题目、摘要、关键词、作者、机构、发表时间;
S2、基于所述论文网络,通过结构合并和属性合并,构建层次图G0,G1,...,GH,其中,所述结构合并包括边合并、结构等效性合并、社区合并;
S3、对所述层次图进行网络表示学习,生成论文节点嵌入表示,包括:
S31、对所述层次图进行层内网络表示学习;
S32、对所述层次图进行层间网络表示学习,具体包括:
1)执行正向初始化:从1层开始到H层,将Gi-1中的多个论文节点的结果嵌入表示
Figure BDA0003739180290000021
执行Max-Pooling以初始化对应的Gi中的超节点u的初始化嵌入表示
Figure BDA0003739180290000022
Figure BDA0003739180290000023
其中,
Figure BDA0003739180290000024
代表在正向初始化过程中i-1层论文节点v的结果嵌入表示,
Figure BDA0003739180290000025
表示在正向初始化过程中i层论文节点u的初始嵌入表示,在原始论文网络图G0中,随机初始化层内表示学习的初始节点嵌入表示;
2)执行反向初始化:从H-1层开始到0层,给定Gi+1中论文节点u新学习到的结果嵌入
Figure BDA0003739180290000031
以及Gi中构成超节点u的原始节点v在正向初始化中生成的结果嵌入
Figure BDA0003739180290000032
执行Mean-Pooling得到论文节点v的新的初始化嵌入
Figure BDA0003739180290000033
Figure BDA0003739180290000034
其中,
Figure BDA0003739180290000035
代表在反向初始化过程中i+1层论文节点u的结果嵌入表示,
Figure BDA0003739180290000036
代表在反向初始化过程中i层论文节点v的初始嵌入表示,在第H层上,令反向初始化过程的论文节点v的初始化嵌入表示
Figure BDA0003739180290000037
等于正向初始化过程的论文节点v的结果嵌入表示
Figure BDA0003739180290000038
S33、采用级联的方式将论文节点各个层次中的反向初始化网络表示拼接起来,生成论文节点嵌入表示,具体为:
Figure BDA0003739180290000039
其中,
Figure BDA00037391802900000310
表示第i层网络中论文节点v的反向初始化网络表示,xv表示论文节点v的嵌入表示;
S4、根据所述论文节点嵌入表示,通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表,并将所述论文推荐列表推荐给用户。
进一步地,步骤S2中,所述层次图的构造过程具体为:根据所述论文网络的结构特征,通过边合并、结构等效性合并和社区合并来合并相似节点以实现结构合并,并计算合并的超节点的属性信息,实现属性合并,结合两个合并结果,迭代此过程,直到层次图的节点数目达到设定的阈值以获得足够小的网络,完成层次图的构建。
进一步地,所述边合并是选择论文网络中成对的相邻顶点,将每对顶点合并为一个新的顶点;所述结构等效性合并是将论文网络中共享共同邻居的节点合并成一个新的超节点;所述社区合并是将一个社区内的节点和边合并为一个新节点。
进一步地,所述社区合并采用Louvain算法,通过最大化模块度来划分社区,将论文网络中的每个论文节点初始化为一个社区,如果两个论文节点合并为一个社区能够改进模块度,则进行合并,直至这种合并不再使模块度有所提高;其中,模块度用来度量社区内部的边缘与社区之间的边缘的密度,模块度的计算公式为:
Figure BDA0003739180290000041
其中,Q代表论文网络的模块度,m是论文网络中所有边的权重和,Aij表示论文节点vi与vj的边权重,ki,kj代表论文节点vi和vj的度,ci和cj是论文节点vi和vj所在的社区;当论文节点vi和vj在同一社区时,δ为1。
进一步地,通过边合并、结构等效合并和社区合并得到一个二进制映射矩阵
Figure BDA0003739180290000042
用以保存合并结果,其中,Vi表示第i层次图Gi的论文节点集合,所述矩阵保留层次图Gi到Gi+1的论文节点映射关系;
Figure BDA0003739180290000043
的值如果为1代表Gi的论文节点r会被合并到Gi+1的超节点j中,否则为0。
进一步地,在层次图构建过程中在结构合并的同时对每次结构合并产生的超节点的属性信息通过并集操作从之前被合并的论文节点获取,超节点的属性是合并前原论文节点集属性的并集。
进一步地,步骤S31中,对所述层次图进行层内网络表示学习包括:对于第i层的层次图Gi及其初始化网络表示Si,使用TADW或CANE属性网络表示学习方法来学习该层网络的网络表示,其中,0≤i≤H。
进一步地,步骤S4具体包括:针对用户看过的论文vi,利用该论文节点的嵌入表示计算与论文网络中其他论文节点的相似度,计算公式如下:
Figure BDA0003739180290000051
其中,xi表示论文节点vi的嵌入表示,⊙表示点乘操作,|xi|表示论文节点vi的嵌入表示的模;Simi,j表示论文节点vi和论文节点vj的相似度;
通过该方法与论文库中的每一篇论文进行比较,得到最终论文节点vi与论文网络中其他论文的相似度向量sIMi
选取时间间隔t内看过论文集合v1,v2,v3......,vn,分别计算该论文节点与论文库中其他论文的相似度向量SIM1,SIM2,SIM3......SIMn.并将相似度向量SIM1,SIM2,SIM3......SIMn求和来获取针对当前用户时间间隔t内看过论文集合的相似度,最后将相似度进行降序排列选取top-k篇论文生成论文推荐列表,并将所述论文推荐列表推荐给用户。
一种基于层次图属性网络表示学习的论文推荐系统,包括:论文网络构建模块、层次图构建模块、分层网络表示学习模块、论文推荐模块;
论文网络构建模块,基于论文库构建论文网络,其中,所述论文网络中的节点表示论文,边表示论文间的引用关系,节点的属性信息为论文的信息,所述论文的信息包括:题目、摘要、关键词、作者、机构、发表时间;
层次图构建模块,基于所述论文网络,通过结构合并和属性合并,构建层次图G0,G1,...,GH,其中,所述结构合并包括边合并、结构等效性合并、社区合并;
分层网络表示学习模块,对所述层次图进行网络表示学习,生成论文节点嵌入表示,包括:
层内网络表示学习模块,对所述层次图进行层内网络表示学习;
层间网络表示学习模块,对所述层次图进行层间网络表示学习,具体包括:
1)执行正向初始化:从1层开始到H层,将Gi-1中的多个论文节点的结果嵌入表示
Figure BDA0003739180290000061
执行Max-Pooling以初始化对应的Gi中的超节点u的初始化嵌入表示
Figure BDA0003739180290000062
Figure BDA0003739180290000063
其中,
Figure BDA0003739180290000064
代表在正向初始化过程中i-1层论文节点v的结果嵌入表示,
Figure BDA0003739180290000065
表示在正向初始化过程中i层论文节点u的初始嵌入表示,在原始论文网络图G0中,随机初始化层内表示学习的初始节点嵌入表示;
2)执行反向初始化:从H-1层开始到0层,给定Gi+1中论文节点u新学习到的结果嵌入
Figure BDA0003739180290000066
以及Gi中构成超节点u的原始节点v在正向初始化中生成的结果嵌入
Figure BDA0003739180290000071
执行Mean-Pooling得到论文节点v的新的初始化嵌入
Figure BDA0003739180290000072
Figure BDA0003739180290000073
其中,
Figure BDA0003739180290000074
代表在反向初始化过程中i+1层论文节点u的结果嵌入表示,
Figure BDA0003739180290000075
代表在反向初始化过程中i层论文节点v的初始嵌入表示,在第H层上,令反向初始化过程的论文节点v的初始化嵌入表示
Figure BDA0003739180290000076
等于正向初始化过程的论文节点v的结果嵌入表示
Figure BDA0003739180290000077
论文节点嵌入表示生成模块,采用级联的方式将论文节点各个层次中的反向初始化网络表示拼接起来,生成论文节点嵌入表示,具体为:
Figure BDA0003739180290000078
其中,
Figure BDA0003739180290000079
表示第i层网络中论文节点v的反向初始化网络表示,xv表示论文节点v的嵌入表示;
论文推荐模块,根据所述论文节点嵌入表示,通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表,并将所述论文推荐列表推荐给用户。本发明还提出一种计算机设备,所述设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明公开的一种基于层次图属性网络表示学习的论文推荐方法及系统。本发明基于层次图属性网络表示学习的论文推荐方法,根据论文库构建论文网络,基于所述论文网络,通过结构合并和属性合并,构建层次图,对所述层次图进行层内网络表示学习和层间网络表示学习,生成节点嵌入表示,通过计算论文节点间的嵌入表示的相似度来生成推荐列表,并将所述推荐列表中的论文推荐给用户,从而从根源上解决了现有的基于网络表示学习方法的论文推荐准确性低、用户满意度低的问题。
与现有技术相比,具有如下有益效果:
1.本发明的基于层次图属性网络表示学习的论文推荐方法,在论文网络上通过结构合并和属性合并构造层次图,在层次图上实现分层网络表示学习,并通过层间网络表示学习的级联得到包含原始网络多阶的结构特征和属性信息的最终论文节点嵌入表示,从而增强了现有的论文网络表示学习方法并提高了论文推荐的准确性,进而提升了用户体验。
2.本发明的基于层次图属性网络表示学习的论文推荐方法,在构建层次图的过程中,通过边合并、结构等效合并和社区合并,分别维护了网络的一阶、二阶邻近性和社区特性,从而保持网络的高阶邻近性,同时将节点的属性信息进行同步合并,集成了网络的拓扑结构和属性信息,提出了一种混合层次图构造方式来维护多阶的网络属性信息,进而提升了论文推荐的准确性,提升了用户体验。
3.本发明的基于层次图属性网络表示学习的论文推荐方法,层间网络表示学习中,先采用最大池化(Max-Pooling)的方法执行正向初始化,将影响最大的特征信息输入到下一层次,减少无用信息的传播;再采用平均池化(Mean-Pooling)的方法求平均的方法执行反向初始化,以减少误差,采用级联的方式将节点各个层次中的反向初始化网络表示拼接起来,优化了论文网络表示学习方法,进而提升了论文推荐的准确性,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于层次图属性网络表示学习的论文推荐方法示意图。
图2为本发明实施例提供的基于层次图属性网络表示学习的论文推荐方法框架图。
图3为本发明实施例提供的边合并和结构等效合并的示意图。
图4为本发明实施例提供的基于层次图属性网络表示学习的论文推荐系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本发明一种基于层次图属性网络表示学习的论文推荐方法。如图1所示,基于层次图属性网络表示学习的论文推荐方法包括以下步骤S1至S4。同时,基于层次图属性网络表示学习的论文推荐方法框架图如图2所示。
S1、基于论文库构建论文网络,其中,所述论文网络中的节点表示论文,边表示论文间的引用关系,节点的属性信息为论文的信息,所述论文的信息包括:题目、摘要、关键词、作者、机构、发表时间。
S2、基于所述论文网络,通过结构合并和属性合并,构建层次图G0,G1,...,GH,其中,所述结构合并包括边合并、结构等效性合并、社区合并。
具体地,步骤S2中,所述层次图的构造过程具体为:根据所述论文网络的结构特征,通过边合并、结构等效性合并和社区合并来合并相似节点以实现结构合并,并计算合并的超节点的属性信息,实现属性合并,结合两个合并结果,迭代此过程,直到层次图的节点数目达到设定的阈值以获得足够小的网络,完成层次图的构建。
(1)结构合并
具体地,网络的结构合并包括三个关键步骤,即边合并、结构等效合并和社区合并,分别维护的是网络的一阶、二阶邻近性和社区特性。通过逐层的合并,从而保持网络的高阶邻近性。
所述边合并是选择论文网络中成对的相邻顶点,将每对顶点合并为一个新的顶点。网络中的一阶邻近性是两个顶点之间的局部成对邻近性。用(vi,vj)表示由边连接的每对节点,边的权重表示节点vi和vj的一阶邻近性。为了保持一阶邻近性,因此需要进行边合并。如附图3过程(a)到(b)中,将节点v1,v2合并成单个节点v12,节点v3,v4合并成单个节点v34,保持了一阶邻近性。本方法采用最大匹配来选择要合并的边,尽可能选取数目最多的边,并且保证没有两条边可以同时合并到同一节点。
所述结构等效性合并是将论文网络中共享共同邻居的节点合并成一个新的超节点。考虑到边合并无法处理网络中的环状结构,因此在边合并后需要进行结构等效性合并。过程(a)到(b)中通过边合并无法处理网络中的环状结构,而节点v12和v34共享邻居节点v57和v68,通过附图2的过程(b)到(c)将共享相似邻居的节点v12和v34合并为超节点v1234即可以处理网络的环状结构又可以保持网络的二阶邻近性。
所述社区合并是将一个社区内的节点和边合并为一个新节点。众所周知,除了网络的一阶、二阶、高阶结构相似性,网络还存在着社区的特性。通过社区发现方法进一步将网络划分成具有层次性的社团结构。
在一具体实施例中,所述社区合并采用Louvain算法,通过最大化模块度来划分社区,将论文网络中的每个论文节点初始化为一个社区,如果两个论文节点合并为一个社区能够改进模块度,则进行合并,直至这种合并不再使模块度有所提高;其中,模块度用来度量社区内部的边缘与社区之间的边缘的密度,模块度的计算公式为:
Figure BDA0003739180290000111
其中,Q代表论文网络的模块度,m是论文网络中所有边的权重和,Aij表示论文节点vi与vj的边权重,ki,kj代表论文节点vi和vj的度,ci和cj是论文节点vi和vj所在的社区;当论文节点vi和vj在同一社区时,δ为1。
在一具体实施例中,通过边合并、结构等效合并和社区合并得到一个二进制映射矩阵
Figure BDA0003739180290000112
用以保存合并结果,其中,Vi表示第i层次图Gi的论文节点集合,所述矩阵保留层次图Gi到Gi+1的论文节点映射关系;
Figure BDA0003739180290000113
的值如果为1代表Gi的论文节点r会被合并到Gi+1的超节点j中,否则为0。映射矩阵同样可以用于后面的属性合并。
(2)属性合并
具体地,在层次图构建过程中在结构合并的同时对每次结构合并产生的超节点的属性信息通过并集操作从之前被合并的论文节点获取,超节点的属性是合并前原论文节点集属性的并集。
由于结构合并时没有涉及到属性信息,为了充分保留其属性信息,因此在层次图构建过程中在结构合并的同时对每次结构合并产生的节点(超节点)的属性信息通过并集操作从之前被合并的论文节点获取。如附图2所示,当论文节点v1,v2v3,v4被合并到超节点v1234,超节点v1234的属性为节点集合v1,v2v3,v4的并集,因此,当Gi中的多个论文节点
Figure BDA0003739180290000121
被合并为Gi+1中的超节点
Figure BDA0003739180290000122
合并到超节点
Figure BDA0003739180290000123
的论文节点序列
Figure BDA0003739180290000124
可以通过映射矩阵Mi,i+1来进行查询。其中,超节点
Figure BDA0003739180290000125
的属性
Figure BDA0003739180290000126
可以为原论文节点集的并集:
Figure BDA0003739180290000127
充分考虑原始网络的结构特性,并通过合并相似节点来将网络迭代构造一系列由细到粗的层次图G0,G1,...,GH。结合以上提出的结构合并和属性合并方法,按照边合并、结构等效性合并、社区合并和属性合并的步骤构建层次图。迭代此过程,直到层次图的节点数目达到设定的阈值以获得足够小的网络。
S3、对所述层次图进行网络表示学习,生成论文节点嵌入表示,包括步骤S31-S33。
S31、对所述层次图进行层内网络表示学习;
具体地,对所述层次图进行层内网络表示学习包括:对于第i层的层次图Gi及其初始化网络表示si,使用TADW或CANE属性网络表示学习方法来学习该层网络的网络表示,其中,0≤i≤H。
S32、对所述层次图进行层间网络表示学习;
为了交互每层网络的表示学习结果,提出了层间表示学习。层间表示学习以一轮循环的方式迭代执行。具体地,从1层开始到H层正向执行初始化,再从H-1层执行到0层反向执行初始化;对于第i(0≤i≤H-1)层的层内网络表示学习被执行两次,而H层的网络仅执行一次。正向执行的方式将节点之间的较细层的特征信息交互引入到较粗层次的层内网络表示学习,反向执行的消息传递方式使较细层的层内表示学习可以了解较粗层的特征信息。
对所述层次图进行层间网络表示学习,具体包括:
(1)执行正向初始化:从1层开始到H层,将Gi-1中的多个论文节点的结果嵌入表示
Figure BDA0003739180290000131
执行Max-Pooling以初始化对应的Gi中的超节点u的初始化嵌入表示
Figure BDA0003739180290000132
Figure BDA0003739180290000133
其中,
Figure BDA0003739180290000134
代表在正向初始化过程中i-1层论文节点v的结果嵌入表示,
Figure BDA0003739180290000135
表示在正向初始化过程中i层论文节点u的初始嵌入表示,在原始论文网络图G0中,随机初始化层内表示学习的初始节点嵌入表示;
对于层次图Gi,为了将影响最大的特征信息输入到下一层次,减少无用信息的传播,在正向执行过程中采用最大池化(Max-P0oling)的方法。
(2)执行反向初始化:从H-1层开始到0层,给定Gi+1中论文节点u新学习到的结果嵌入
Figure BDA0003739180290000141
以及Gi中构成超节点u的原始节点v在正向初始化中生成的结果嵌入
Figure BDA0003739180290000142
执行Mean-Pooling得到论文节点v的新的初始化嵌入
Figure BDA0003739180290000143
Figure BDA0003739180290000144
其中,
Figure BDA0003739180290000145
代表在反向初始化过程中i+1层论文节点u的结果嵌入表示,
Figure BDA0003739180290000146
代表在反向初始化过程中i层论文节点v的初始嵌入表示,在第H层上,令反向初始化过程的论文节点v的初始化嵌入表示
Figure BDA0003739180290000147
等于正向初始化过程的论文节点v的结果嵌入表示
Figure BDA0003739180290000148
考虑到在反向传播过程中,当前层和下一层的特征信息都具有一定贡献,因此采用平均池化(Mean-Pooling)的方法求平均以减少误差。
总结上述过程,层间网络表示学习先执行正向初始化,再执行反向初始化。当执行正向初始化时,Gi在层内表示学习中生成节点嵌入表示后,将通过Max-Pooling将其初始化为Gi+1的节点嵌入表示,直到i=H。之后执行反向初始化,Gi+1在层内表示学习中生成节点嵌入表示后,将通过Mean-Pooling将其初始化为Gi的节点嵌入,直到i=0。
S33、采用级联的方式将论文节点各个层次中的反向初始化网络表示拼接起来,生成论文节点嵌入表示,具体为:
Figure BDA0003739180290000149
其中,
Figure BDA0003739180290000151
表示第i层网络中论文节点v的反向初始化网络表示,xv表示论文节点v的嵌入表示。假设每个层次的节点表示的维数相等且为a,则最终的节点表示的维数为(H+1)d。
在步骤S33中,在反向初始化过程中学习到每一层的节点嵌入表示
Figure BDA0003739180290000152
后,为了使最终的节点嵌入表示同时包含层次网络的结构信息和属性信息。
S4、根据所述论文节点嵌入表示,通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表,并将所述论文推荐列表推荐给用户。
在通过层次图属性网络表示学习得到节点的嵌入表示过后,通过计算论文节点的嵌入表示的相似度来生成论文推荐列表。
在一具体实施例中,针对用户看过的论文vi,利用该论文节点的嵌入表示计算与论文网络中其他论文节点的相似度,计算公式如下:
Figure BDA0003739180290000153
其中,xi表示论文节点vi的嵌入表示,⊙表示点乘操作,|xi|表示论文节点vi的嵌入表示的模;Simi,j表示论文节点vi和论文节点vj的相似度;
通过该方法与论文库中的每一篇论文进行比较,得到最终论文节点vi与论文网络中其他论文的相似度向量SIMi
选取时间间隔t内看过论文集合v1,v2,v3......,vn,分别计算该论文节点与论文库中其他论文的相似度向量SIM1,SIM2,SIM3......SIMn.并将相似度向量SIM1,SIM2,SIM3......SIMn求和来获取针对当前用户时间间隔t内看过论文集合的相似度,最后将相似度进行降序排列选取top-k篇论文生成论文推荐列表,并将所述论文推荐列表推荐给用户。
图4是本发明实施例提供的一种基于层次图属性网络表示学习的论文推荐系统。如图4所示,该基于层次图属性网络表示学习的论文推荐系统包括论文网络构建模块、层次图构建模块、分层网络表示学习模块、论文推荐模块。
论文网络构建模块,基于论文库构建论文网络,其中,所述论文网络中的节点表示论文,边表示论文间的引用关系,节点的属性信息为论文的信息,所述论文的信息包括:题目、摘要、关键词、作者、机构、发表时间;
层次图构建模块,基于所述论文网络,通过结构合并和属性合并,构建层次图G0,G1,...,GH,其中,所述结构合并包括边合并、结构等效性合并、社区合并;
分层网络表示学习模块,对所述层次图进行网络表示学习,生成论文节点嵌入表示,包括层内网络表示学习模块、层间网络表示学习模块和论文节点嵌入表示生成模块,具体地:
层内网络表示学习模块,对所述层次图进行层内网络表示学习;
层间网络表示学习模块,对所述层次图进行层间网络表示学习,具体包括:
1)执行正向初始化:从1层开始到H层,将Gi-1中的多个论文节点的结果嵌入表示
Figure BDA0003739180290000161
执行Max-Pooling以初始化对应的Gi中的超节点u的初始化嵌入表示
Figure BDA0003739180290000171
Figure BDA0003739180290000172
其中,
Figure BDA0003739180290000173
代表在正向初始化过程中i-1层论文节点v的结果嵌入表示,
Figure BDA0003739180290000174
表示在正向初始化过程中i层论文节点u的初始嵌入表示,在原始论文网络图G0中,随机初始化层内表示学习的初始节点嵌入表示;
2)执行反向初始化:从H-1层开始到0层,给定Gi+1中论文节点u新学习的结果嵌入
Figure BDA0003739180290000175
以及Gi中构成超节点u的原始节点v在正向初始化中生成的结果嵌入
Figure BDA0003739180290000176
执行Mean-Pooling得到论文节点v的新的初始化嵌入
Figure BDA0003739180290000177
Figure BDA0003739180290000178
其中,
Figure BDA0003739180290000179
代表在反向初始化过程中i+1层论文节点u的结果嵌入表示,
Figure BDA00037391802900001710
代表在反向初始化过程中i层论文节点v的初始嵌入表示,在第H层上,令反向初始化过程的论文节点v的初始化嵌入表示
Figure BDA00037391802900001711
等于正向初始化过程的论文节点v的结果嵌入表示
Figure BDA00037391802900001712
论文节点嵌入表示生成模块,采用级联的方式将论文节点各个层次中的反向初始化网络表示拼接起来,生成论文节点嵌入表示,具体为:
Figure BDA00037391802900001713
其中,
Figure BDA00037391802900001714
表示第i层网络中论文节点v的反向初始化网络表示,xv表示论文节点v的嵌入表示;
论文推荐模块,根据所述论文节点嵌入表示,通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表,并将所述论文推荐列表推荐给用户。
上述基于层次图属性网络表示学习的论文推荐系统可以实现为一种计算机程序的形式,该计算机程序可以在计算机设备上运行。
该计算机设备可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
该非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行一种基于层次图属性网络表示学习的论文推荐方法。
该处理器用于提供计算和控制能力,以支撑整个计算机设备的运行。
该内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行一种基于层次图属性网络表示学习的论文推荐方法。
该网络接口用于与其它设备进行网络通信。本领域技术人员可以理解,上述计算机设备结构仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器用于运行存储在存储器中的计算机程序,该程序实现实施例一所述的基于层次图属性网络表示学习的论文推荐方法。
应当理解,在本申请实施例中,处理器可以是中央处理单元(Central ProcessingUnit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行实施例一所述的一种基于层次图属性网络表示学习的论文推荐方法。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种基于层次图属性网络表示学习的论文推荐方法,其特征在于,包括步骤:
S1、基于论文库构建论文网络,其中,所述论文网络中的节点表示论文,边表示论文间的引用关系,节点的属性信息为论文的信息,所述论文的信息包括:题目、摘要、关键词、作者、机构、发表时间;
S2、基于所述论文网络,通过结构合并和属性合并,构建层次图G0,G1,...,GH,其中,所述结构合并包括边合并、结构等效性合并、社区合并;
S3、对所述层次图进行网络表示学习,生成论文节点嵌入表示,包括:
S31、对所述层次图进行层内网络表示学习;
S32、对所述层次图进行层间网络表示学习,具体包括:
1)执行正向初始化:从1层开始到H层,将Gi-1中的多个论文节点的结果嵌入表示
Figure FDA0003739180280000011
执行Max-Pooling以初始化对应的Gi中的超节点u的初始化嵌入表示
Figure FDA0003739180280000012
Figure FDA0003739180280000013
其中,
Figure FDA0003739180280000014
代表在正向初始化过程中i-1层论文节点v的结果嵌入表示,
Figure FDA0003739180280000015
表示在正向初始化过程中i层论文节点u的初始嵌入表示,在原始论文网络图G0中,随机初始化层内表示学习的初始节点嵌入表示;
2)执行反向初始化:从H-1层开始到0层,给定Gi+1中论文节点u新学习到的结果嵌入
Figure FDA0003739180280000016
以及Gi中构成超节点u的原始节点v在正向初始化中生成的结果嵌入
Figure FDA0003739180280000027
执行Mean-Pooling得到论文节点v的新的初始化嵌入
Figure FDA0003739180280000028
Figure FDA0003739180280000029
其中,
Figure FDA0003739180280000021
代表在反向初始化过程中i+1层论文节点u的结果嵌入表示,
Figure FDA0003739180280000022
代表在反向初始化过程中i层论文节点v的初始嵌入表示,在第H层上,令反向初始化过程的论文节点v的初始化嵌入表示
Figure FDA0003739180280000023
等于正向初始化过程的论文节点v的结果嵌入表示
Figure FDA0003739180280000024
S33、采用级联的方式将论文节点各个层次中的反向初始化网络表示拼接起来,生成论文节点嵌入表示,具体为:
Figure FDA0003739180280000025
其中,
Figure FDA0003739180280000026
表示第i层网络中论文节点v的反向初始化网络表示,xv表示论文节点v的嵌入表示;
S4、根据所述论文节点嵌入表示,通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表,并将所述论文推荐列表推荐给用户。
2.根据权利要求1所述的方法,其特征在于,步骤S2中,所述层次图的构造过程具体为:根据所述论文网络的结构特征,通过边合并、结构等效性合并和社区合并来合并相似节点以实现结构合并,并计算合并的超节点的属性信息,实现属性合并,结合两个合并结果,迭代此过程,直到层次图的节点数目达到设定的阈值以获得足够小的网络,完成层次图的构建。
3.根据权利要求2所述的方法,其特征在于,所述边合并是选择论文网络中成对的相邻顶点,将每对顶点合并为一个新的顶点;所述结构等效性合并是将论文网络中共享共同邻居的节点合并成一个新的超节点;所述社区合并是将一个社区内的节点和边合并为一个新节点。
4.根据权利要求3所述的方法,其特征在于,所述社区合并采用Louvain算法,通过最大化模块度来划分社区,将论文网络中的每个论文节点初始化为一个社区,如果两个论文节点合并为一个社区能够改进模块度,则进行合并,直至这种合并不再使模块度有所提高;其中,模块度用来度量社区内部的边缘与社区之间的边缘的密度,模块度的计算公式为:
Figure FDA0003739180280000031
其中,Q代表论文网络的模块度,m是论文网络中所有边的权重和,Aij表示论文节点vi与vj的边权重,ki,kj代表论文节点vi和vj的度,ci和cj是论文节点vi和vj所在的社区;当论文节点vi和vj在同一社区时,δ为1。
5.根据权利要求2所述的方法,其特征在于,通过边合并、结构等效合并和社区合并得到一个二进制映射矩阵
Figure FDA0003739180280000032
用以保存合并结果,其中,Vi表示第i层次图Gi的论文节点集合,所述矩阵保留层次图Gi到Gi+1的论文节点映射关系;
Figure FDA0003739180280000033
的值如果为1代表Gi的论文节点r会被合并到Gi+1的超节点j中,否则为0。
6.根据权利要求2所述的方法,其特征在于,在层次图构建过程中在结构合并的同时对每次结构合并产生的超节点的属性信息通过并集操作从之前被合并的论文节点获取,超节点的属性是合并前原论文节点集属性的并集。
7.根据权利要求1所述的方法,其特征在于,步骤S31中,对所述层次图进行层内网络表示学习包括:对于第i层的层次图Gi及其初始化网络表示Si,使用TADW或CANE属性网络表示学习方法来学习该层网络的网络表示,其中,0≤i≤H。
8.根据权利要求1所述的方法,其特征在于,步骤S4具体包括:针对用户看过的论文vi,利用该论文节点的嵌入表示计算与论文网络中其他论文节点的相似度,计算公式如下:
Figure FDA0003739180280000041
其中,xi表示论文节点vi的嵌入表示,⊙表示点乘操作,|xi|表示论文节点vi的嵌入表示的模;Simi,j表示论文节点vi和论文节点vj的相似度;
通过该方法与论文库中的每一篇论文进行比较,得到最终论文节点vi与论文网络中其他论文的相似度向量SIMi
选取时间间隔t内看过论文集合v1,v2,v3......,vn,分别计算该论文节点与论文库中其他论文的相似度向量SIM1,SIM2,SIM3......SIMn.并将相似度向量SIM1,SIM2,SIM3......SIMn求和来获取针对当前用户时间间隔t内看过论文集合的相似度,最后将相似度进行降序排列选取top-k篇论文生成论文推荐列表,并将所述论文推荐列表推荐给用户。
9.一种基于层次图属性网络表示学习的论文推荐系统,包括:论文网络构建模块、层次图构建模块、分层网络表示学习模块、论文推荐模块;
论文网络构建模块,基于论文库构建论文网络,其中,所述论文网络中的节点表示论文,边表示论文间的引用关系,节点的属性信息为论文的信息,所述论文的信息包括:题目、摘要、关键词、作者、机构、发表时间;
层次图构建模块,基于所述论文网络,通过结构合并和属性合并,构建层次图G0,G1,...,GH,其中,所述结构合并包括边合并、结构等效性合并、社区合并;分层网络表示学习模块,对所述层次图进行网络表示学习,生成论文节点嵌入表示,包括层内网络表示学习模块、层间网络表示学习模块、论文节点嵌入表示生成模块:
层内网络表示学习模块,对所述层次图进行层内网络表示学习;
层间网络表示学习模块,对所述层次图进行层间网络表示学习,具体包括:
1)执行正向初始化:从1层开始到H层,将Gi-1中的多个论文节点的结果嵌入表示
Figure FDA0003739180280000051
执行Max-Pooling以初始化对应的Gi中的超节点u的初始化嵌入表示
Figure FDA0003739180280000052
Figure FDA0003739180280000053
其中,
Figure FDA0003739180280000054
代表在正向初始化过程中i-1层论文节点v的结果嵌入表示,
Figure FDA0003739180280000055
表示在正向初始化过程中i层论文节点u的初始嵌入表示,在原始论文网络图G0中,随机初始化层内表示学习的初始节点嵌入表示;
2)执行反向初始化:从H-1层开始到0层,给定Gi+1中论文节点u新学习到的结果嵌入
Figure FDA0003739180280000056
以及Gi中构成超节点u的原始节点v在正向初始化中生成的结果嵌入
Figure FDA0003739180280000057
执行Mean-Pooling得到论文节点v的新的初始化嵌入
Figure FDA0003739180280000058
Figure FDA0003739180280000061
其中,
Figure FDA0003739180280000062
代表在反向初始化过程中i+1层论文节点u的结果嵌入表示,
Figure FDA0003739180280000063
代表在反向初始化过程中i层论文节点v的初始嵌入表示,在第H层上,令反向初始化过程的论文节点v的初始化嵌入表示
Figure FDA0003739180280000064
等于正向初始化过程的论文节点v的结果嵌入表示
Figure FDA0003739180280000065
论文节点嵌入表示生成模块,采用级联的方式将论文节点各个层次中的反向初始化网络表示拼接起来,生成论文节点嵌入表示,具体为:
Figure FDA0003739180280000066
其中,
Figure FDA0003739180280000067
表示第i层网络中论文节点v的反向初始化网络表示,xv表示论文节点v的嵌入表示;
论文推荐模块,根据所述论文节点嵌入表示,通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表,并将所述论文推荐列表推荐给用户。
10.一种计算机设备,其特征在于,所述设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的方法。
CN202210811231.5A 2022-07-11 2022-07-11 基于层次图属性网络表示学习的论文推荐方法及系统 Pending CN115329189A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210811231.5A CN115329189A (zh) 2022-07-11 2022-07-11 基于层次图属性网络表示学习的论文推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210811231.5A CN115329189A (zh) 2022-07-11 2022-07-11 基于层次图属性网络表示学习的论文推荐方法及系统

Publications (1)

Publication Number Publication Date
CN115329189A true CN115329189A (zh) 2022-11-11

Family

ID=83918321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210811231.5A Pending CN115329189A (zh) 2022-07-11 2022-07-11 基于层次图属性网络表示学习的论文推荐方法及系统

Country Status (1)

Country Link
CN (1) CN115329189A (zh)

Similar Documents

Publication Publication Date Title
Zeng et al. Graphsaint: Graph sampling based inductive learning method
Kermany et al. A hybrid multi-criteria recommender system using ontology and neuro-fuzzy techniques
Zhu et al. Aligraph: A comprehensive graph neural network platform
JP7105789B2 (ja) ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置
Papadakis et al. Collaborative filtering recommender systems taxonomy
US20120330864A1 (en) Fast personalized page rank on map reduce
Friedrich et al. Heavy-tailed mutation operators in single-objective combinatorial optimization
CN112417313A (zh) 一种基于知识图卷积网络的模型混合推荐方法
Mahoney Approximate computation and implicit regularization for very large-scale data analysis
Jiang et al. Clustering and constructing user coresets to accelerate large-scale top-k recommender systems
Xu et al. Towards machine-learning-driven effective mashup recommendations from big data in mobile networks and the Internet-of-Things
Sun et al. Graph force learning
Pillutla et al. Federated learning with superquantile aggregation for heterogeneous data
Ma et al. Identification of multi-layer networks community by fusing nonnegative matrix factorization and topological structural information
Hou et al. Meta-code: Community detection via exploratory learning in topologically unknown networks
Angone et al. Hybrid quantum-classical multilevel approach for maximum cuts on graphs
Shu et al. Multi-task feature and structure learning for user-preference based knowledge-aware recommendation
Hang et al. Generalized framework for personalized recommendations in agent networks
CN114510642B (zh) 基于异构信息网络的书籍推荐方法、系统及设备
CN116821519A (zh) 一种基于图结构的系统过滤和降噪的智能推荐方法
CN116974249A (zh) 柔性作业车间调度方法和柔性作业车间调度装置
CN115329189A (zh) 基于层次图属性网络表示学习的论文推荐方法及系统
Li et al. Effective hybrid graph and hypergraph convolution network for collaborative filtering
Zhang et al. Development of FriendLink similarity metric for link prediction in weighted multiplex networks
Chen et al. A recommender system fused with implicit social information through network representation learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination