CN115329189A

CN115329189A - 基于层次图属性网络表示学习的论文推荐方法及系统

Info

Publication number: CN115329189A
Application number: CN202210811231.5A
Authority: CN
Inventors: 周明强; 韩奇志; 李梦娇; 张程
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2022-07-11
Filing date: 2022-07-11
Publication date: 2022-11-11

Abstract

本发明提供了基于层次图属性网络表示学习的论文推荐方法及系统，方法包括：基于论文库构建论文网络；基于所述论文网络，通过边合并、结构等效性合并、社区合并和属性合并，构建层次图；对所述层次图进行层内网络表示学习以及层间网络表示学习，生成论文节点嵌入表示，所述层间网络表示学习先执行正向初始化，再执行反向初始化的层间网络表示学习；基于所述论文节点嵌入表示，所述通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表，并将所述论文推荐列表中的论文推荐给用户。本发明采用基于层次图属性网络表示学习的论文推荐方法，从而从根源上解决了现有的基于网络表示学习方法的论文推荐准确率低的问题。

Description

基于层次图属性网络表示学习的论文推荐方法及系统

技术领域

本发明属于个性化推荐领域，具体涉及一种基于层次图属性网络表示学习的论文推荐方法及系统。

背景技术

随着互联网的高速发展以及知识的快速更新，网络上发表的科研论文发表数量爆炸式增长，科研信息过载使得研究人员需要花费大量的时间和精力查找其所需要的论文信息。间接造成了科研浪费。论文推荐准确的将论文推荐给研究人员，正成为科研工作不可或缺的部分。与论文推荐相关的算法大多基于网络表示学习。基于网络表示学习的论文推荐算法通常将论文数据库中的论文抽象为节点，论文之间的引用关系抽象为边，论文的题目，摘要，关键词，作者，机构，发表时间等抽象为节点的属性信息，在通过网络表示学习方法将网络中的节点表示为低维嵌入表示，并用于论文的推荐。

然而，目前大多数关于网络表示学习的研究都是基于网络结构，例如利用网络节点生成的游走序列、一阶邻近性、二阶邻近性、高阶邻近性等网络结构进行网络表示学习并取得了一定的成功，但这类方法未考虑论文节点的属性信息，难以准确的推荐论文。同时，论文数据库生成的论文网络中拥有大量的结构数据，此外网络还包含各种类型的异构的属性信息，数据量大同时网络结构疏密迥异，邻接信息差异巨大，如何在网络表示中集成拓扑结构和属性信息的同时平衡两者的关系，获取网络中每个论文节点的嵌入表示来进行论文的推荐是十分困难的。

因此，如何提高论文推荐准确性以及提升用户满意度，是本领域亟待解决的问题。

发明内容

本发明的目的是针对现有技术的缺陷，提供一种基于层次图属性网络表示学习的论文推荐方法及系统。本发明基于层次图属性网络表示学习的论文推荐方法，根据论文库构建论文网络，基于所述论文网络，通过结构合并和属性合并，构建层次图，对所述层次图进行层内网络表示学习和层间网络表示学习，生成节点嵌入表示，通过计算论文节点间的嵌入表示的相似度来生成推荐列表，并将所述推荐列表中的论文推荐给用户，从而从根源上解决了现有的基于网络表示学习方法的论文推荐准确性低、用户满意度低的问题。

为了实现以上目的，本发明采用以下技术方案：

一种基于层次图属性网络表示学习的论文推荐方法，其特征在于，包括步骤：

S1、基于论文库构建论文网络，其中，所述论文网络中的节点表示论文，边表示论文间的引用关系，节点的属性信息为论文的信息，所述论文的信息包括：题目、摘要、关键词、作者、机构、发表时间；

S2、基于所述论文网络，通过结构合并和属性合并，构建层次图G⁰，G¹，...，G^H，其中，所述结构合并包括边合并、结构等效性合并、社区合并；

S3、对所述层次图进行网络表示学习，生成论文节点嵌入表示，包括：

S31、对所述层次图进行层内网络表示学习；

S32、对所述层次图进行层间网络表示学习，具体包括：

1)执行正向初始化：从1层开始到H层，将G^i-1中的多个论文节点的结果嵌入表示

执行Max-Pooling以初始化对应的Gⁱ中的超节点u的初始化嵌入表示

其中，

代表在正向初始化过程中i-1层论文节点v的结果嵌入表示，

表示在正向初始化过程中i层论文节点u的初始嵌入表示，在原始论文网络图G⁰中，随机初始化层内表示学习的初始节点嵌入表示；

2)执行反向初始化：从H-1层开始到0层，给定Gⁱ⁺¹中论文节点u新学习到的结果嵌入

以及Gⁱ中构成超节点u的原始节点v在正向初始化中生成的结果嵌入

执行Mean-Pooling得到论文节点v的新的初始化嵌入

其中，

代表在反向初始化过程中i+1层论文节点u的结果嵌入表示，

代表在反向初始化过程中i层论文节点v的初始嵌入表示，在第H层上，令反向初始化过程的论文节点v的初始化嵌入表示

等于正向初始化过程的论文节点v的结果嵌入表示

S33、采用级联的方式将论文节点各个层次中的反向初始化网络表示拼接起来，生成论文节点嵌入表示，具体为：

其中，

表示第i层网络中论文节点v的反向初始化网络表示，x_v表示论文节点v的嵌入表示；

S4、根据所述论文节点嵌入表示，通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表，并将所述论文推荐列表推荐给用户。

进一步地，步骤S2中，所述层次图的构造过程具体为：根据所述论文网络的结构特征，通过边合并、结构等效性合并和社区合并来合并相似节点以实现结构合并，并计算合并的超节点的属性信息，实现属性合并，结合两个合并结果，迭代此过程，直到层次图的节点数目达到设定的阈值以获得足够小的网络，完成层次图的构建。

进一步地，所述边合并是选择论文网络中成对的相邻顶点，将每对顶点合并为一个新的顶点；所述结构等效性合并是将论文网络中共享共同邻居的节点合并成一个新的超节点；所述社区合并是将一个社区内的节点和边合并为一个新节点。

进一步地，所述社区合并采用Louvain算法，通过最大化模块度来划分社区，将论文网络中的每个论文节点初始化为一个社区，如果两个论文节点合并为一个社区能够改进模块度，则进行合并，直至这种合并不再使模块度有所提高；其中，模块度用来度量社区内部的边缘与社区之间的边缘的密度，模块度的计算公式为：

其中，Q代表论文网络的模块度，m是论文网络中所有边的权重和，A_ij表示论文节点v_i与v_j的边权重，k_i，k_j代表论文节点v_i和v_j的度，c_i和c_j是论文节点v_i和v_j所在的社区；当论文节点v_i和v_j在同一社区时，δ为1。

进一步地，通过边合并、结构等效合并和社区合并得到一个二进制映射矩阵

用以保存合并结果，其中，V_i表示第i层次图Gⁱ的论文节点集合，所述矩阵保留层次图Gⁱ到Gⁱ⁺¹的论文节点映射关系；

的值如果为1代表Gⁱ的论文节点r会被合并到Gⁱ⁺¹的超节点j中，否则为0。

进一步地，在层次图构建过程中在结构合并的同时对每次结构合并产生的超节点的属性信息通过并集操作从之前被合并的论文节点获取，超节点的属性是合并前原论文节点集属性的并集。

进一步地，步骤S31中，对所述层次图进行层内网络表示学习包括：对于第i层的层次图Gⁱ及其初始化网络表示Sⁱ，使用TADW或CANE属性网络表示学习方法来学习该层网络的网络表示，其中，0≤i≤H。

进一步地，步骤S4具体包括：针对用户看过的论文v_i，利用该论文节点的嵌入表示计算与论文网络中其他论文节点的相似度，计算公式如下：

其中，x_i表示论文节点v_i的嵌入表示，⊙表示点乘操作，|x_i|表示论文节点v_i的嵌入表示的模；Sim_i，j表示论文节点v_i和论文节点v_j的相似度；

通过该方法与论文库中的每一篇论文进行比较，得到最终论文节点v_i与论文网络中其他论文的相似度向量sIM_i；

选取时间间隔t内看过论文集合v₁，v₂，v₃......，v_n，分别计算该论文节点与论文库中其他论文的相似度向量SIM₁，SIM₂，SIM₃......SIM_n.并将相似度向量SIM₁，SIM₂，SIM₃......SIM_n求和来获取针对当前用户时间间隔t内看过论文集合的相似度，最后将相似度进行降序排列选取top-k篇论文生成论文推荐列表，并将所述论文推荐列表推荐给用户。

一种基于层次图属性网络表示学习的论文推荐系统，包括：论文网络构建模块、层次图构建模块、分层网络表示学习模块、论文推荐模块；

论文网络构建模块，基于论文库构建论文网络，其中，所述论文网络中的节点表示论文，边表示论文间的引用关系，节点的属性信息为论文的信息，所述论文的信息包括：题目、摘要、关键词、作者、机构、发表时间；

层次图构建模块，基于所述论文网络，通过结构合并和属性合并，构建层次图G⁰，G¹，...，G^H，其中，所述结构合并包括边合并、结构等效性合并、社区合并；

分层网络表示学习模块，对所述层次图进行网络表示学习，生成论文节点嵌入表示，包括：

层内网络表示学习模块，对所述层次图进行层内网络表示学习；

层间网络表示学习模块，对所述层次图进行层间网络表示学习，具体包括：

其中，

代表在正向初始化过程中i-1层论文节点v的结果嵌入表示，

执行Mean-Pooling得到论文节点v的新的初始化嵌入

其中，

代表在反向初始化过程中i+1层论文节点u的结果嵌入表示，

等于正向初始化过程的论文节点v的结果嵌入表示

论文节点嵌入表示生成模块，采用级联的方式将论文节点各个层次中的反向初始化网络表示拼接起来，生成论文节点嵌入表示，具体为：

其中，

论文推荐模块，根据所述论文节点嵌入表示，通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表，并将所述论文推荐列表推荐给用户。本发明还提出一种计算机设备，所述设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现上述的方法。

本发明公开的一种基于层次图属性网络表示学习的论文推荐方法及系统。本发明基于层次图属性网络表示学习的论文推荐方法，根据论文库构建论文网络，基于所述论文网络，通过结构合并和属性合并，构建层次图，对所述层次图进行层内网络表示学习和层间网络表示学习，生成节点嵌入表示，通过计算论文节点间的嵌入表示的相似度来生成推荐列表，并将所述推荐列表中的论文推荐给用户，从而从根源上解决了现有的基于网络表示学习方法的论文推荐准确性低、用户满意度低的问题。

与现有技术相比，具有如下有益效果：

1.本发明的基于层次图属性网络表示学习的论文推荐方法，在论文网络上通过结构合并和属性合并构造层次图，在层次图上实现分层网络表示学习，并通过层间网络表示学习的级联得到包含原始网络多阶的结构特征和属性信息的最终论文节点嵌入表示，从而增强了现有的论文网络表示学习方法并提高了论文推荐的准确性，进而提升了用户体验。

2.本发明的基于层次图属性网络表示学习的论文推荐方法，在构建层次图的过程中，通过边合并、结构等效合并和社区合并，分别维护了网络的一阶、二阶邻近性和社区特性，从而保持网络的高阶邻近性，同时将节点的属性信息进行同步合并，集成了网络的拓扑结构和属性信息，提出了一种混合层次图构造方式来维护多阶的网络属性信息，进而提升了论文推荐的准确性，提升了用户体验。

3.本发明的基于层次图属性网络表示学习的论文推荐方法，层间网络表示学习中，先采用最大池化(Max-Pooling)的方法执行正向初始化，将影响最大的特征信息输入到下一层次，减少无用信息的传播；再采用平均池化(Mean-Pooling)的方法求平均的方法执行反向初始化，以减少误差，采用级联的方式将节点各个层次中的反向初始化网络表示拼接起来，优化了论文网络表示学习方法，进而提升了论文推荐的准确性，提升了用户体验。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于层次图属性网络表示学习的论文推荐方法示意图。

图2为本发明实施例提供的基于层次图属性网络表示学习的论文推荐方法框架图。

图3为本发明实施例提供的边合并和结构等效合并的示意图。

图4为本发明实施例提供的基于层次图属性网络表示学习的论文推荐系统示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

下面结合附图和具体实施例对本发明作进一步说明，但不作为本发明的限定。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

本发明一种基于层次图属性网络表示学习的论文推荐方法。如图1所示，基于层次图属性网络表示学习的论文推荐方法包括以下步骤S1至S4。同时，基于层次图属性网络表示学习的论文推荐方法框架图如图2所示。

S1、基于论文库构建论文网络，其中，所述论文网络中的节点表示论文，边表示论文间的引用关系，节点的属性信息为论文的信息，所述论文的信息包括：题目、摘要、关键词、作者、机构、发表时间。

S2、基于所述论文网络，通过结构合并和属性合并，构建层次图G⁰，G¹，...，G^H，其中，所述结构合并包括边合并、结构等效性合并、社区合并。

具体地，步骤S2中，所述层次图的构造过程具体为：根据所述论文网络的结构特征，通过边合并、结构等效性合并和社区合并来合并相似节点以实现结构合并，并计算合并的超节点的属性信息，实现属性合并，结合两个合并结果，迭代此过程，直到层次图的节点数目达到设定的阈值以获得足够小的网络，完成层次图的构建。

(1)结构合并

具体地，网络的结构合并包括三个关键步骤，即边合并、结构等效合并和社区合并，分别维护的是网络的一阶、二阶邻近性和社区特性。通过逐层的合并，从而保持网络的高阶邻近性。

所述边合并是选择论文网络中成对的相邻顶点，将每对顶点合并为一个新的顶点。网络中的一阶邻近性是两个顶点之间的局部成对邻近性。用(v_i，v_j)表示由边连接的每对节点，边的权重表示节点v_i和v_j的一阶邻近性。为了保持一阶邻近性，因此需要进行边合并。如附图3过程(a)到(b)中，将节点v₁，v₂合并成单个节点v₁₂，节点v₃，v₄合并成单个节点v₃₄，保持了一阶邻近性。本方法采用最大匹配来选择要合并的边，尽可能选取数目最多的边，并且保证没有两条边可以同时合并到同一节点。

所述结构等效性合并是将论文网络中共享共同邻居的节点合并成一个新的超节点。考虑到边合并无法处理网络中的环状结构，因此在边合并后需要进行结构等效性合并。过程(a)到(b)中通过边合并无法处理网络中的环状结构，而节点v₁₂和v₃₄共享邻居节点v₅₇和v₆₈，通过附图2的过程(b)到(c)将共享相似邻居的节点v₁₂和v₃₄合并为超节点v₁₂₃₄即可以处理网络的环状结构又可以保持网络的二阶邻近性。

所述社区合并是将一个社区内的节点和边合并为一个新节点。众所周知，除了网络的一阶、二阶、高阶结构相似性，网络还存在着社区的特性。通过社区发现方法进一步将网络划分成具有层次性的社团结构。

在一具体实施例中，所述社区合并采用Louvain算法，通过最大化模块度来划分社区，将论文网络中的每个论文节点初始化为一个社区，如果两个论文节点合并为一个社区能够改进模块度，则进行合并，直至这种合并不再使模块度有所提高；其中，模块度用来度量社区内部的边缘与社区之间的边缘的密度，模块度的计算公式为：

在一具体实施例中，通过边合并、结构等效合并和社区合并得到一个二进制映射矩阵

的值如果为1代表Gⁱ的论文节点r会被合并到Gⁱ⁺¹的超节点j中，否则为0。映射矩阵同样可以用于后面的属性合并。

(2)属性合并

具体地，在层次图构建过程中在结构合并的同时对每次结构合并产生的超节点的属性信息通过并集操作从之前被合并的论文节点获取，超节点的属性是合并前原论文节点集属性的并集。

由于结构合并时没有涉及到属性信息，为了充分保留其属性信息，因此在层次图构建过程中在结构合并的同时对每次结构合并产生的节点(超节点)的属性信息通过并集操作从之前被合并的论文节点获取。如附图2所示，当论文节点v₁，v₂v₃，v₄被合并到超节点v₁₂₃₄，超节点v₁₂₃₄的属性为节点集合v₁，v₂v₃，v₄的并集，因此，当G_i中的多个论文节点

被合并为G_i+1中的超节点

合并到超节点

的论文节点序列

可以通过映射矩阵M^i，i+1来进行查询。其中，超节点

的属性

可以为原论文节点集的并集：

充分考虑原始网络的结构特性，并通过合并相似节点来将网络迭代构造一系列由细到粗的层次图G⁰，G¹，...，G^H。结合以上提出的结构合并和属性合并方法，按照边合并、结构等效性合并、社区合并和属性合并的步骤构建层次图。迭代此过程，直到层次图的节点数目达到设定的阈值以获得足够小的网络。

S3、对所述层次图进行网络表示学习，生成论文节点嵌入表示，包括步骤S31-S33。

S31、对所述层次图进行层内网络表示学习；

具体地，对所述层次图进行层内网络表示学习包括：对于第i层的层次图Gⁱ及其初始化网络表示sⁱ，使用TADW或CANE属性网络表示学习方法来学习该层网络的网络表示，其中，0≤i≤H。

S32、对所述层次图进行层间网络表示学习；

为了交互每层网络的表示学习结果，提出了层间表示学习。层间表示学习以一轮循环的方式迭代执行。具体地，从1层开始到H层正向执行初始化，再从H-1层执行到0层反向执行初始化；对于第i(0≤i≤H-1)层的层内网络表示学习被执行两次，而H层的网络仅执行一次。正向执行的方式将节点之间的较细层的特征信息交互引入到较粗层次的层内网络表示学习，反向执行的消息传递方式使较细层的层内表示学习可以了解较粗层的特征信息。

对所述层次图进行层间网络表示学习，具体包括：

(1)执行正向初始化：从1层开始到H层，将G^i-1中的多个论文节点的结果嵌入表示

其中，

代表在正向初始化过程中i-1层论文节点v的结果嵌入表示，

对于层次图Gⁱ，为了将影响最大的特征信息输入到下一层次，减少无用信息的传播，在正向执行过程中采用最大池化(Max-P0oling)的方法。

(2)执行反向初始化：从H-1层开始到0层，给定Gⁱ⁺¹中论文节点u新学习到的结果嵌入

执行Mean-Pooling得到论文节点v的新的初始化嵌入

其中，

代表在反向初始化过程中i+1层论文节点u的结果嵌入表示，

等于正向初始化过程的论文节点v的结果嵌入表示

考虑到在反向传播过程中，当前层和下一层的特征信息都具有一定贡献，因此采用平均池化(Mean-Pooling)的方法求平均以减少误差。

总结上述过程，层间网络表示学习先执行正向初始化，再执行反向初始化。当执行正向初始化时，Gⁱ在层内表示学习中生成节点嵌入表示后，将通过Max-Pooling将其初始化为Gⁱ⁺¹的节点嵌入表示，直到i＝H。之后执行反向初始化，Gⁱ⁺¹在层内表示学习中生成节点嵌入表示后，将通过Mean-Pooling将其初始化为Gⁱ的节点嵌入，直到i＝0。

其中，

表示第i层网络中论文节点v的反向初始化网络表示，x_v表示论文节点v的嵌入表示。假设每个层次的节点表示的维数相等且为a，则最终的节点表示的维数为(H+1)d。

在步骤S33中，在反向初始化过程中学习到每一层的节点嵌入表示

后，为了使最终的节点嵌入表示同时包含层次网络的结构信息和属性信息。

在通过层次图属性网络表示学习得到节点的嵌入表示过后，通过计算论文节点的嵌入表示的相似度来生成论文推荐列表。

在一具体实施例中，针对用户看过的论文v_i，利用该论文节点的嵌入表示计算与论文网络中其他论文节点的相似度，计算公式如下：

图4是本发明实施例提供的一种基于层次图属性网络表示学习的论文推荐系统。如图4所示，该基于层次图属性网络表示学习的论文推荐系统包括论文网络构建模块、层次图构建模块、分层网络表示学习模块、论文推荐模块。

分层网络表示学习模块，对所述层次图进行网络表示学习，生成论文节点嵌入表示，包括层内网络表示学习模块、层间网络表示学习模块和论文节点嵌入表示生成模块，具体地：

其中，

代表在正向初始化过程中i-1层论文节点v的结果嵌入表示，

2)执行反向初始化：从H-1层开始到0层，给定Gⁱ⁺¹中论文节点u新学习的结果嵌入

执行Mean-Pooling得到论文节点v的新的初始化嵌入

其中，

代表在反向初始化过程中i+1层论文节点u的结果嵌入表示，

等于正向初始化过程的论文节点v的结果嵌入表示

其中，

论文推荐模块，根据所述论文节点嵌入表示，通过计算论文节点间的嵌入表示的相似度来生成论文推荐列表，并将所述论文推荐列表推荐给用户。

上述基于层次图属性网络表示学习的论文推荐系统可以实现为一种计算机程序的形式，该计算机程序可以在计算机设备上运行。

该计算机设备可以是服务器，其中，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

计算机设备包括通过系统总线连接的处理器、存储器和网络接口，其中，存储器可以包括非易失性存储介质和内存储器。

该非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行一种基于层次图属性网络表示学习的论文推荐方法。

该处理器用于提供计算和控制能力，以支撑整个计算机设备的运行。

该内存储器为非易失性存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行一种基于层次图属性网络表示学习的论文推荐方法。

该网络接口用于与其它设备进行网络通信。本领域技术人员可以理解，上述计算机设备结构仅仅是与本申请方案相关的部分结构，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器用于运行存储在存储器中的计算机程序，该程序实现实施例一所述的基于层次图属性网络表示学习的论文推荐方法。

应当理解，在本申请实施例中，处理器可以是中央处理单元(Central ProcessingUnit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令，计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序，其中该计算机程序被处理器执行时使处理器执行实施例一所述的一种基于层次图属性网络表示学习的论文推荐方法。

所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的。例如，各个单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种基于层次图属性网络表示学习的论文推荐方法，其特征在于，包括步骤：

S31、对所述层次图进行层内网络表示学习；

S32、对所述层次图进行层间网络表示学习，具体包括：

其中，

代表在正向初始化过程中i-1层论文节点v的结果嵌入表示，

执行Mean-Pooling得到论文节点v的新的初始化嵌入

其中，

代表在反向初始化过程中i+1层论文节点u的结果嵌入表示,

等于正向初始化过程的论文节点v的结果嵌入表示

其中，

2.根据权利要求1所述的方法，其特征在于，步骤S2中，所述层次图的构造过程具体为：根据所述论文网络的结构特征，通过边合并、结构等效性合并和社区合并来合并相似节点以实现结构合并，并计算合并的超节点的属性信息，实现属性合并，结合两个合并结果，迭代此过程，直到层次图的节点数目达到设定的阈值以获得足够小的网络，完成层次图的构建。

3.根据权利要求2所述的方法，其特征在于，所述边合并是选择论文网络中成对的相邻顶点，将每对顶点合并为一个新的顶点；所述结构等效性合并是将论文网络中共享共同邻居的节点合并成一个新的超节点；所述社区合并是将一个社区内的节点和边合并为一个新节点。

4.根据权利要求3所述的方法，其特征在于，所述社区合并采用Louvain算法，通过最大化模块度来划分社区，将论文网络中的每个论文节点初始化为一个社区，如果两个论文节点合并为一个社区能够改进模块度，则进行合并，直至这种合并不再使模块度有所提高；其中，模块度用来度量社区内部的边缘与社区之间的边缘的密度，模块度的计算公式为：

其中，Q代表论文网络的模块度，m是论文网络中所有边的权重和，A_ij表示论文节点v_i与v_j的边权重，k_i,k_j代表论文节点v_i和v_j的度，c_i和c_j是论文节点v_i和v_j所在的社区；当论文节点v_i和v_j在同一社区时，δ为1。

5.根据权利要求2所述的方法，其特征在于，通过边合并、结构等效合并和社区合并得到一个二进制映射矩阵

6.根据权利要求2所述的方法，其特征在于，在层次图构建过程中在结构合并的同时对每次结构合并产生的超节点的属性信息通过并集操作从之前被合并的论文节点获取，超节点的属性是合并前原论文节点集属性的并集。

7.根据权利要求1所述的方法，其特征在于，步骤S31中，对所述层次图进行层内网络表示学习包括：对于第i层的层次图Gⁱ及其初始化网络表示Sⁱ，使用TADW或CANE属性网络表示学习方法来学习该层网络的网络表示，其中，0≤i≤H。

8.根据权利要求1所述的方法，其特征在于，步骤S4具体包括：针对用户看过的论文v_i，利用该论文节点的嵌入表示计算与论文网络中其他论文节点的相似度，计算公式如下：

选取时间间隔t内看过论文集合v₁，v₂，v₃......，v_n,分别计算该论文节点与论文库中其他论文的相似度向量SIM₁，SIM₂，SIM₃......SIM_n.并将相似度向量SIM₁，SIM₂，SIM₃......SIM_n求和来获取针对当前用户时间间隔t内看过论文集合的相似度，最后将相似度进行降序排列选取top-k篇论文生成论文推荐列表，并将所述论文推荐列表推荐给用户。

9.一种基于层次图属性网络表示学习的论文推荐系统，包括：论文网络构建模块、层次图构建模块、分层网络表示学习模块、论文推荐模块；

层次图构建模块，基于所述论文网络，通过结构合并和属性合并，构建层次图G⁰，G¹，...，G^H，其中，所述结构合并包括边合并、结构等效性合并、社区合并；分层网络表示学习模块，对所述层次图进行网络表示学习，生成论文节点嵌入表示，包括层内网络表示学习模块、层间网络表示学习模块、论文节点嵌入表示生成模块：