CN117763238B - 基于多图神经网络的学位论文评审专家推荐方法 - Google Patents
基于多图神经网络的学位论文评审专家推荐方法 Download PDFInfo
- Publication number
- CN117763238B CN117763238B CN202410028509.0A CN202410028509A CN117763238B CN 117763238 B CN117763238 B CN 117763238B CN 202410028509 A CN202410028509 A CN 202410028509A CN 117763238 B CN117763238 B CN 117763238B
- Authority
- CN
- China
- Prior art keywords
- keyword
- expert
- node
- embedded
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012552 review Methods 0.000 title claims abstract description 24
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 21
- 238000012512 characterization method Methods 0.000 claims abstract description 42
- 238000012163 sequencing technique Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 93
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000004220 aggregation Methods 0.000 claims description 25
- 238000010276 construction Methods 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 19
- 230000002776 aggregation Effects 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 12
- 230000007246 mechanism Effects 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 101100481876 Danio rerio pbk gene Proteins 0.000 claims description 3
- 101100481878 Mus musculus Pbk gene Proteins 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于多图神经网络的学位论文评审专家推荐方法,根据论文中关键词与专家发表论文关键词数据,首先构建关键词与专家二分图,通过图卷积神经网络挖掘关键词和专家之间的高阶关系。其次,由于一篇论文存在多个关键词,因此需要构建关键词与关键词共现图,通过图注意力网络挖掘关键词之间相关性。然后通过多层感知机将多个关键词融合捕获关键词之间的隐式关联性,生成多个关键词整体的表征。最后使用关键词整体表征与专家表征交互输出预测相似度,排序所有专家与关键词的相似度并推荐前K个专家。本发明提高了评审专家的推荐结果,可以用于学位论文评审工作,提高学位论文管理者的工作效率和学位论文评审的质量。
Description
技术领域
本发明属于推荐系统技术领域,具体地说,是一种基于多图神经网络的学位论文评审专家推荐方法。
背景技术
随着信息化建设以及互联网领域的快速发展,为了解决信息过载的难题,并为人们提供有效信息,推荐技术己成为众多研究者关注的技术。在各大电子商务网站上,都会利用许多快速高效的推荐方法提高服务质量,比如根据用户的浏览记录、喜好商品等信息,为用户推荐可能购买的物品,这样的推荐技术还应用于新闻信息、音乐、电影、书籍等。在学位论文评审中,同样存在类似的应用场景,即为学位论文推荐合适的评审专家,评审论文并给予质量上的评论与建议。
在过去的一些研究中,论文评审专家推荐方法主要是围绕基于文本的方法来研究,基于词信息模型,通过词袋模型(BOW),利用TF-IDF来获取论文文档与专家出版物的关键信息,然后根据关键信息计算相似度,基于词信息模型虽然可以表征论文的词频特征,但是不能描述语义信息;基于主题模型,包括概率潜在语义分析(PLSA)与隐含狄利克雷分布(LDA),PLSA是假设每个文档包含一系列可能的潜在主题,并且根据主题的分布以一定的概率生成中的词。利用PLSA从论文和升审稿人出版物中提取主题,然后通过主题距离来衡量相似度;基于LDA的方法,将审稿人出版物连接到单个文档中创建审稿人的文档,然后使用LDA模型从审稿人的文档和论文中提出抽象特征,最后通过点积等指标来衡量匹配度。与基于词信息模型的方法相比,主题模型可以挖掘文本更深层的语义信息,从而获得更准确的相似度。但是语义模型不能充分利用同一主题不同词之间的隐含语义关联。基于神经网络模型,获得一组低维密度向量作为文本的语义表示,然后利用余弦相似度等方法计算不同文本之间的相似度。目前有几种方法用于计算文本相似度,word2vec、doc2vec、RNN、LSTM、CNN等。通过使用神经网络模型,文档文本的表示不必依赖传统的特征工程,可以获得更高精度的论文和审稿人深度语义表示。但是同行评审过程中真实的审稿人分配数据通常不会公开访问,从而导致帧数训练数据的缺乏。神经网络模型通常是用一般文本数据来训练的,在一定程度上影响了特征提取的效果。
近年来,大量的推荐算法已被提出,协同过滤技术是现代推荐系统的常用的技术,协同过滤常见的形式是将用户和项目作为嵌入参数化,并通过重构历史用户项交互来学习嵌入参数,早期的协同过滤模型使用矩阵分解,将用户ID投影到嵌入向量中。最近的神经网络推荐模型NCF使用了相同的嵌入部分,同时增强了与神经网络的交互建模。与之相关的研究点是利用用户-物品图结构进行推荐,神经网络通过对图结构,特别是高跳邻居的建模,用于指导嵌入学习。GraphSage和GCN在空间域中重新定义了图卷积,对相邻节点的嵌入进行聚合,细化目标节点的嵌入。在此基础上NGCF,GCMC,PinSage等最近的研究将GCN用于用户-物品交互图中,在多跳邻居中捕获信号进行推荐,已取得很好的效果。但是由于学位论文评审专家的特殊性,需要捕获多个关键词与单个专家之间的关系,在这些单图模型中无法满足该推荐任务的需求。
发明内容
本发明的目的在于提供一种基于多图神经网络的学位论文评审专家推荐方法。
实现本发明目的的技术解决方案为:一种基于多图神经网络的学位论文评审专家推荐方法,包括:
(1)利用预训练语言模型BERT获得输入关键词的嵌入向量,通过可学习的Embedding操作将输入的专家one-hot稀疏向量转化为稠密向量,最终得到专家的嵌入向量;
(2)根据论文中关键词与专家发表论文关键词数据,分别构建关键词与专家二分图和关键词与关键词共现图;
(3)将关键词和专家的嵌入向量输入到关键词与专家二分图中,并将关键词的嵌入向量输入到关键词与关键词共现图中,此时图中关键节点和专家节点已携带嵌入向量信息,利用加权平均操作和注意力机制将图中邻居节点的信息传递到目标节点,然后使用拼接聚合方法聚合邻居节点和目标节点的信息,得到节点的嵌入表示;
(4)通过堆叠多个图卷积层和图注意力层实现高阶传播,将每一层的输出作为下一层的输入,通过多次迭代信息传播和非线性变换,使关键词节点和专家节点能够逐渐融合更多的上下文信息,最终通过连接操作合并多个网络层输出的节点嵌入表示,得到关键词节点和专家节点的表征;
(5)得到多个关键词表征后,将多个关键词融合输入到多层感知机中,得到最终的整体关键词表征;
(6)将得到的整体关键词表征和专家表征进行交互操作来预测关键词与专家之间的相似度,通过排序所有专家与关键词的相似度并推荐前K个专家。
进一步地,步骤(1)获取关键词和专家的嵌入向量,关键词k是通过预训练语言模型BERT得到,它的嵌入向量表示为
专家r的输入为稀疏的one-hot编码为xr,采用Embedding过程将one-hot转换为稠密的嵌入向量表示为:
其中Wembed表示可学习的嵌入矩阵。
进一步地,步骤(2)中关键词-专家二分图构建,如果专家r发表或者评审的论文中关键词列表为ks={k1,k2,k3,…},则专家与这些关键词都是有关联的;因此{(r,k1),(r,k2),(r,k3)}为图中的边集合,r表示专家节点,k表示关键词节点,与专家节点r相连的关键词节点集合称为专家r的近邻居集合N(r);将关键词-专家二分图KR看作无向图,节点之间边定义如下:
其中KRk,r表示KR二分图中从点k到点r的一条边;
关键词-关键词共现图构建,关键词与关键词之间的共现图是通过共现频率来反应的;如果一篇论文或者专家的关键词列表为ks={k1,k2,k3,…},则可以构成关键词对{(k1,k2),(k1,k3),(k2,k3)};构造共现图,首先计算关键词对的共现频数,如果关键词k1与关键词k2同时出现在同一片论文或者属于同一个专家的关键列表中,那么关键词对(k1,k2)加1,在获得频数矩阵后,通过设置阈值来进行过滤,节点之前的边定义如下:
其中表示关键词-关键词共现图中从k1到k2的一条边,α表示关键词对频数的阈值,fre(·)表示计算关键词的频数。
进一步地,步骤(3)的具体实现方法如下:
3.1消息构建
对于专家节点r,从关键词节点k到专家节点r的边,构建从节点k到节点r的信息mr←k,表示为:
其中,Wrk是消息传递时可训练权重参数,ek是关键词k的初始化嵌入表示,Nr和Nk分别表示专家和关键词邻居的个数;
当专家节点收到所有邻居节点的消息后,利用求和操作来进行合并,即可得到专家r所有邻居节点传递信息的嵌入表示表示为:
对于关键词节点k,关键词节点k的信息构建需要在两个图结构中进行;
在关键词-专家二分图中使用与专家节点相同的消息构建方式,关键词k所有邻居节点传递信息的嵌入表示表示为:
其中,Wkr是消息传递时可训练权重参数,er是专家k的初始化嵌入表示;
对于关键词与关键词共现图,在进行消息构建时引入注意力机制,关键词节点p向关键词节点q传递信息mq←p,表示为:
mq←p=αpqWpqep
其中,Wpq表示消息传递时可训练权重参数,ep是关键词节点的初始化嵌入表示,αpq为节点的注意力系数,计算方式定义如下:
xpq=f(Wep,Weq)
其中,xpq表示注意力系数,f(·)是映射函数将一对向量映射成数值,k∈N(q)表示k属于关键词q的邻居节点;
当关键词节点收到所有邻居节点的消息后,利用求和操作来进行合并,即可得到关键词节点q所有邻居节点传递信息的嵌入表示定义如下:
3.2消息聚合
在接收到合并的邻居信息后,更新目标节点的嵌入,此操作即为消息聚合;聚合从邻居节点传播过来的信息,需要融合节点自身的嵌入表示;
通过专家节点初始嵌入向量和关键词与二分图中关键词邻居节点传递消息的嵌入向量/>聚合得到专家节点嵌入表示/>定义如下:
通过关键词节点初始嵌入向量和关键词与二分图中关键词邻居节点传递消息的嵌入向量/>聚合得到关键词节点的嵌入表示/>定义如下:
通过关键词节点初始嵌入向量和关键词与关键词共现图中关键词邻居节点传递消息的嵌入向量/>聚合得到关键词节点的嵌入表示/>定义如下:
其中,LeakyReLU为激活函数,可以编码正值的信息,同时也可编码来自负值的一些信息。
进一步地,步骤(4)的具体实现包括:
在关键词与专家二分图结构中堆叠n个卷积层实现高阶传播,将每一层输出的嵌入表示作为下一层的输入,然后通过加权平均信息构建和拼接聚合操作后使用非线性激活函数对嵌入表示进行非线性变换;在第l层的传播后专家节点的嵌入向量和关键词节点的嵌入向量/>可表示为:
其中第l层专家r接收来自邻居节点的信息和关键词k接收来自邻居节点信息定义如下:
其中,表示在第l层中消息构建所使用的权重矩阵,/>和/>表示上一层消息传递中生成嵌入表示,Nr和Nk分别表示专家和关键词邻居的个数;
在关键词与关键词共现图结构中堆叠n个图注意力层实现高阶传播,将每一层输出的嵌入表示作为下一层的输入,然后通过注意力机制进行信息构建和拼接聚合操作后使用非线性激活函数对嵌入表示进行非线性变换;关键词节点在第l层的传播后节点的嵌入向量可表示为:
其中第l层关键词q接收来自邻居节点的信息定义如下:
其中,表示在第l层中消息构建所使用的权重矩阵,W表示可训练参数矩阵,表示上一层消息传递中生成的专家嵌入表示,αpq表示节点的注意力系数;
经过n层传播后,每个节点可得到多个嵌入表示,为专家节点的多个嵌入表示,/>和/>是从两种图结构中得到的关键词嵌入表示,在不同层中获得的嵌入表示强调的是不同连接路径的消息,它们反应的是不同的上下文信息,将不同层中获得的嵌入表示融合在一起形成最终表征,使用连接操作,具体公式定义如下:
其中,表示专家表征,/>与/>分别表示在关键词与专家二分图结构和关键词与关键词共现图结构中的关键词表征。
进一步地,步骤(5)的具体实现方法为:
首先将两种图结构输出的嵌入表示进行连接操作,单个关键词最终的嵌入表示定义如下:
根据给定的关键词集合ks,将对应的关键词嵌入表示通过向量堆叠操作得到矩阵Eks,对矩阵Eks进行平均池化操作得到MLP的输入嵌入表示eks;将向量eks输入到具有两层的MLP,在MLP的非线性学习能力下捕获关键词之间的关联性,最终输出多个关键词融合的整体表征emks,定义如下:
et=ReLU(W1·Avg(Eks)+b1)
emks=ReLU(W2et+b2)
其中,Avg(Eks)表示对矩阵进行平均池化操作,et表示第一层输出的向量,W1,b1,W2,b2分别表示用于线性变换使用的第一层和第二层的可训练的参数。
进一步地,步骤(6)的具体实现方法为:
通过对关键词表征与专家的表征/>进行内积操作来预测关键词与专家之间的相似度/>
然后通过构建所有专家的表征矩阵ER,与关键词表征进行内积交互操作,输出为关键词与所有专家的相似度向量定义如下:
最后通过对相似度向量进行排序,输出排序前K的专家为最终的推荐结果resks;
其中,argsort(·)表示根据向量值排序输出索引向量的函数,K表示自定义参数,TopK表示输出向量中前K个值的函数。
本发明与现有技术相比,其显著优点:(1)将学位论文评审专家推荐定义为标准的推荐问题,构建专家和关键词二分图,强调专家和关键词表征的重要性,与传统基于文本的论文评审专家比,大大提高了推荐的效率。(2)构建关键词与关键词之间的共现图,用于捕获关键词之间的相关性,并且提出一种融合方法将多个关键词的表征融合成一个表征,表示多个关键词整体表征与单个专家表征的相似度计算。
附图说明
图1是本发明基于多图神经网络的学位论文评审专家推荐方法的流程图。
具体实施方式
下面结合说明书附图对本发明作进一步描述。
本发明一种基于多图神经网络的学位论文评审专家推荐方法,通过微调后预训练语言模型BERT获得关键词的嵌入向量,专家的嵌入向量通过可学习参数向量表示,主要作用是将one-hot编码后的稀疏特征向量转换为高维线性空间中的稠密向量,然后将得到关键词嵌入向量和专家嵌入向量一起作为图神经网络的输出;在关键词与专家二分图上,利用图卷积网络来挖掘关键词与专家之间关系,在图卷积过程中利用信息构建和聚合操作最终可到专家和关键词的表征;在关键词与关键词共现图上,利用图注意力网络可得到关键词与关键词之间的共现关系,图注意力网络中在信息构建的过程中引入自注意力机制,实现对邻居节点的加权聚合,最终可得到在此图结构中的关键词的表征;在图神经网络中进行高阶传播和消息融合,主要目的是为了获得节点之间的高阶关系。得到多个关键词表征后,将多个关键词融合输入到多层感知机中得到最终的整体关键词表征。最后通过关键词和专家的表征进行交互操作来预测关键词与专家之间的相似度,排序所有专家与关键词的相似度并推荐前K个专家。
结合图1,本发明一种基于多图神经网络的学位论文评审专家推荐方法,具体包含以下步骤:
1、利用预训练语言模型BERT获得输入关键词的嵌入向量,通过可学习的Embedding操作将输入的专家one-hot稀疏向量转化为稠密向量,最终的到专家的嵌入向量。
2、根据论文中关键词与专家发表论文关键词数据,分别构建关键词与专家二分图和关键词与关键词共现图。
3、将关键词和专家的嵌入向量输入到关键词与专家二分图中,并将关键词的嵌入向量输入到关键词与关键词共现图中,此时图中关键节点和专家节点已携带嵌入向量信息,利用加权平均操作和注意力机制将图中邻居节点的信息传递到目标节点,然后使用拼接聚合方法聚合邻居节点和目标节点的信息,得到节点的嵌入表示;
4、通过堆叠多个图卷积层和图注意力层实现高阶传播,将每一层的输出作为下一层的输入,通过多次迭代信息传播和非线性变换,使关键词节点和专家节点能够逐渐融合更多的上下文信息,最终通过连接操作合并多个网络层输出的节点嵌入表示,得到关键词节点和专家节点的表征;
5、得到多个关键词表征后,将多个关键词融合输入到多层感知机中得到最终的整体关键词表征。
6、将得到的整体关键词表征和专家表征进行交互操作来预测关键词与专家之间的相似度,通过排序所有专家与关键词的相似度并推荐前K个专家。
进一步地,步骤1获取关键词和专家的嵌入向量,关键词k是通过预训练语言模型BERT得到它的嵌入向量可以表示为:
由于专家r的输入为稀疏的one-hot编码xr,为了降低输入维度,采用Embedding过程将one-hot转换为稠密的嵌入向量可以表示为:
其中Wembed表示可学习的嵌入矩阵。
进一步地,步骤2关键词-专家二分图构建,如果专家r发表或者评审的论文中关键词列表为ks={k1,k2,k3,…},则专家与这些关键词都是有关联的;因此{(r,k1),(r,k2),(r,k3)}为图中的边集合,r表示专家节点,k表示关键词节点,与专家节点r相连的关键词节点集合称为专家r的近邻居集合N(r);我们将关键词-专家二分图KR看作无向图,节点之间边定义如下:
其中KRk,r表示KR二分图中从点k到点r的一条边。
关键词-关键词共现图构建,关键词与关键词之间的共现图主要是通过共现频率来反应的。具体来说,如果一篇论文或者专家的关键词列表为ks={k1,k2,k3,…},那么可以构成关键词对{(k1,k2),(k1,k3),(k2,k3)}。构造共现图,首先需要计算关键词对的共现频数,如果关键词k1与关键词k2同时出现在同一片论文或者属于同一个专家的关键列表中,那么关键词对(k1,k2)加1,在获得频数矩阵后,通过手动设置阈值来进行过滤,节点之前的边定义如下。
其中表示关键词-关键词共现图中从k1到k2的一条边,α表示关键词对频数的阈值,fre(·)表示计算关键词的频数。
进一步地,步骤3在利用加权平均操作和注意力机制将图中邻居节点的信息传递到目标节点,然后使用拼接聚合方法聚合邻居节点和目标节点的信息,得到节点的嵌入表示,消息构建和聚合方式如下:
(1)消息构建
对于专家节点r,从关键词节点k到专家节点r的边,构建从节点k到节点r的信息mr←k,可表示为:
其中Wrk是消息传递时可训练权重参数,ek是关键词k的初始化嵌入表示,Nr和Nk分别表示专家和关键词邻居的个数。
当专家节点收到所有邻居节点的消息后,利用求和操作来进行合并,即可得到专家r所有邻居节点传递信息的嵌入表示可表示为:
对于关键词节点k,本文中关键词节点k的信息构建需要在两个图结构中进行,在关键词-专家二分图中使用与专家节点相同的消息构建方式,关键词k所有邻居节点传递信息的嵌入表示可表示为:
其中Wkr是消息传递时可训练权重参数,er表示专家k的初始化嵌入表示。
另一个图结构为关键词与关键词共现图,在进行消息构建时引入注意力机制,主要为了区分不同的邻居关键词节点对目标关键词节点的贡献度。关键词节点p向关键词节点q传递信息mq←p可表示为:
mq←p=αpqWpqep
其中Wpq表示消息传递时可训练权重参数,ep表示关键词节点的初始化嵌入表示,αpq为节点的注意力系数,计算方式定义如下:
xpq=f(Wep,Weq)
其中xpq表示注意力系数,f(·)是映射函数将一对向量映射成数值,k∈N(q)表示k属于关键词q的邻居节点。
当关键词节点收到所有邻居节点的消息后,利用求和操作来进行合并,即可得到关键词节点q所有邻居节点传递信息的嵌入表示定义如下:
(2)消息聚合
在接收到合并的邻居信息后,下一步就更新目标节点的嵌入,此操作称为消息聚合。我们需要聚合从邻居节点传播过来的信息,信息聚合需要融合节点自身的嵌入表示。
通过专家节点初始嵌入向量和关键词与二分图中关键词邻居节点传递消息的嵌入向量/>聚合得到专家节点嵌入表示/>定义如下:
通过关键词节点初始嵌入向量和关键词与二分图中关键词邻居节点传递消息的嵌入向量/>聚合得到关键词节点的嵌入表示/>定义如下:
通过关键词节点初始嵌入向量和关键词与关键词共现图中关键词邻居节点传递消息的嵌入向量/>聚合得到关键词节点的嵌入表示/>定义如下:
其中,LeakyReLU为激活函数,可以编码正值的信息,同时也可编码来自负值的一些信息。
进一步地,步骤4通过一阶连接已经可以增强表征,我们还能堆叠更多的嵌入传播层来研究高阶连接信息,进一步将一跳传播扩展到多跳的传播。具体来说,在关键词与专家二分图结构中堆叠n个卷积层实现高阶传播,将每一层输出的嵌入表示作为下一层的输入,然后通过加权平均信息构建和拼接聚合操作后使用非线性激活函数对嵌入表示进行非线性变换;在第l层的传播后专家节点的嵌入向量和关键词节点的嵌入向量/>可表示为:
其中第l层专家r接收来自邻居节点的信息和关键词k接收来自邻居节点信息定义如下:
其中,表示在第l层中消息构建所使用的权重矩阵,/>和/>表示上一层消息传递中生成嵌入表示,Nr和Nk分别表示专家和关键词邻居的个数;
在关键词与关键词共现图结构中堆叠n个图注意力层实现高阶传播,将每一层输出的嵌入表示作为下一层的输入,然后通过注意力机制进行信息构建和拼接聚合操作后使用非线性激活函数对嵌入表示进行非线性变换;关键词节点在第l层的传播后节点的嵌入向量可表示为:
其中第l层关键词q接收来自邻居节点的信息定义如下:
其中,表示在第l层中消息构建所使用的权重矩阵,W表示可训练参数矩阵,表示上一层消息传递中生成的专家嵌入表示,αpq表示节点的注意力系数;
经过n层传播后,每个节点可得到多个嵌入表示,为专家节点的多个嵌入表示,/>和/>是从两种图结构中得到的关键词嵌入表示,在不同层中获得的嵌入表示强调的是不同连接路径的消息,它们反应的是不同的上下文信息,将不同层中获得的嵌入表示融合在一起形成最终表征,使用连接操作,具体公式定义如下:
其中,表示专家表征,/>与/>分别表示在关键词与专家二分图结构和关键词与关键词共现图结构中的关键词表征。
进一步地,步骤5为了将多个关键词融合捕获关键词之间的内在隐形关联性,使用多层感知机的方法,该方法可以描述关键词之间的非线性相互作用,最后生成一个整体的关键词表征。具体做法为,为了得到单个关键词最终的嵌入表示,首先将两种图结构输出的嵌入表示进行连接操作,单个关键词最终的嵌入表示定义如下:
根据给定的关键词集合ks,将对应的关键词嵌入表示通过向量堆叠操作得到矩阵Eks,为了得到一个整体的向量表示,需要对矩阵Eks进行平均池化操作得到MLP的输入嵌入表示eks。最后向量eks,输入到具有两层的MLP,在MLP的非线性学习能力下捕获关键词之间的关联性,最终输出多个关键词融合的整体嵌入表示emks,定义如下:
et=ReLU(W1·Avg(Eks)+b1)
emks=ReLU(W2et+b2)
其中Avg(Eks)表示对矩阵进行平均池化操作,et表示第一层输出的向量,W1,b1,W2,b2分别表示用于线性变换使用的第一层和第二层的可训练的参数。
进一步地,步骤6最后通过对关键词表征与专家的表征/>进行内积操作来预测关键词与专家之间的相似度/>
然后通过构建所有专家的表征矩阵ER,与关键词表征进行内积交互操作,输出为关键词与所有专家的相似度向量定义如下:
最后通过对相似度向量进行排序,输出排序前前K的专家为最终的推荐结果resks;
其中,argsort(·)表示根据向量值排序输出索引向量的函数,K表示自定义参数,TopK表示输出向量中前K个值的函数。
本发明提供的方法主要解决的是多关键词如何融合与专家进行相似度计算的问题,利用关键词与专家和关键词与关键词之间的交互数据,分别构建关键词与专家二分图和关键词与关键词共现图,使用图神经网络可以丰富专家和关键词的嵌入表示,充分挖掘关键词与专家之间的高阶关系,并提出多关键词融合成一个整体嵌入表示的方法,提高评审专家的推荐结果。
Claims (6)
1.一种基于多图神经网络的学位论文评审专家推荐方法,其特征在于:
(1)利用预训练语言模型BERT获得输入关键词的嵌入向量,通过可学习的Embedding操作将输入的专家one-hot稀疏向量转化为稠密向量,最终得到专家的嵌入向量;
(2)根据论文中关键词与专家发表论文关键词数据,分别构建关键词与专家二分图和关键词与关键词共现图;
关键词-专家二分图构建,如果专家r发表或者评审的论文中关键词列表为ks={k1,k2,k3,...},则专家与这些关键词都是有关联的;因此{(r,k1),(r,k2),(r,k3)}为图中的边集合,r表示专家节点,k表示关键词节点,与专家节点r相连的关键词节点集合称为专家r的近邻居集合N(r);将关键词-专家二分图KR看作无向图,节点之间边定义如下:
其中KRk,r表示KR二分图中从点k到点r的一条边;
关键词-关键词共现图构建,关键词与关键词之间的共现图是通过共现频率来反应的;如果一篇论文或者专家的关键词列表为ks={k1,k2,k3,...},则可以构成关键词对{(k1,k2),(k1,k3),(k2,k3)};构造共现图,首先计算关键词对的共现频数,如果关键词k1与关键词k2同时出现在同一片论文或者属于同一个专家的关键列表中,那么关键词对(k1,k2)加1,在获得频数矩阵后,通过设置阈值来进行过滤,节点之前的边定义如下:
其中表示关键词-关键词共现图中从k1到k2的一条边,α表示关键词对频数的阈值,fre(·)表示计算关键词的频数;
(3)将关键词和专家的嵌入向量输入到关键词与专家二分图中,并将关键词的嵌入向量输入到关键词与关键词共现图中,此时图中关键节点和专家节点已携带嵌入向量信息,利用加权平均操作和注意力机制将图中邻居节点的信息传递到目标节点,然后使用拼接聚合方法聚合邻居节点和目标节点的信息,得到节点的嵌入表示;
(4)通过堆叠多个图卷积层和图注意力层实现高阶传播,将每一层的输出作为下一层的输入,通过多次迭代信息传播和非线性变换,使关键词节点和专家节点能够逐渐融合更多的上下文信息,最终通过连接操作合并多个网络层输出的节点嵌入表示,得到关键词节点和专家节点的表征;
(5)得到多个关键词表征后,将多个关键词融合输入到多层感知机中,得到最终的整体关键词表征;
(6)将得到的整体关键词表征和专家表征进行交互操作来预测关键词与专家之间的相似度,通过排序所有专家与关键词的相似度并推荐前K个专家。
2.根据权利要求1所述的基于多图神经网络的学位论文评审专家推荐方法,其特征在于:步骤(1)获取关键词和专家的嵌入向量,关键词k是通过预训练语言模型BERT得到,它的嵌入向量表示为
专家r的输入为稀疏的one-hot编码为xr,采用Embedding过程将one-hot转换为稠密的嵌入向量表示为:
其中Wembed表示可学习的嵌入矩阵。
3.根据权利要求1所述的基于多图神经网络的学位论文评审专家推荐方法,其特征在于:步骤(3)的具体实现方法如下:
3.1消息构建
对于专家节点r,从关键词节点k到专家节点r的边,构建从节点k到节点r的信息mr←k,表示为:
其中,Wrk是消息传递时可训练权重参数,ek是关键词k的初始化嵌入表示,Nr和Nk分别表示专家和关键词邻居的个数;
当专家节点收到所有邻居节点的消息后,利用求和操作来进行合并,即可得到专家r所有邻居节点传递信息的嵌入表示表示为:
对于关键词节点k,关键词节点k的信息构建需要在两个图结构中进行;
在关键词-专家二分图中使用与专家节点相同的消息构建方式,关键词k所有邻居节点传递信息的嵌入表示表示为:
其中,Wkr是消息传递时可训练权重参数,er是专家k的初始化嵌入表示;
对于关键词与关键词共现图,在进行消息构建时引入注意力机制,关键词节点p向关键词节点q传递信息mq←p,表示为:
mq←p=αpqWpqep
其中,Wpq表示消息传递时可训练权重参数,ep是关键词节点的初始化嵌入表示,αpq为节点的注意力系数,计算方式定义如下:
xpq=f(Wep,Weq)
其中,xpq表示注意力系数,f(·)是映射函数将一对向量映射成数值,k∈N(q)表示k属于关键词q的邻居节点;
当关键词节点收到所有邻居节点的消息后,利用求和操作来进行合并,即可得到关键词节点q所有邻居节点传递信息的嵌入表示定义如下:
3.2消息聚合
在接收到合并的邻居信息后,更新目标节点的嵌入,此操作即为消息聚合;聚合从邻居节点传播过来的信息,需要融合节点自身的嵌入表示;
通过专家节点初始嵌入向量和关键词与二分图中关键词邻居节点传递消息的嵌入向量/>聚合得到专家节点嵌入表示/>定义如下:
通过关键词节点初始嵌入向量和关键词与二分图中关键词邻居节点传递消息的嵌入向量/>聚合得到关键词节点的嵌入表示/>定义如下:
通过关键词节点初始嵌入向量和关键词与关键词共现图中关键词邻居节点传递消息的嵌入向量/>聚合得到关键词节点的嵌入表示
定义如下:
其中,LeakyReLU为激活函数,可以编码正值的信息,同时也可编码来自负值的一些信息。
4.根据权利要求1所述的基于多图神经网络的学位论文评审专家推荐方法,其特征在于,步骤(4)的具体实现包括:
在关键词与专家二分图结构中堆叠n个卷积层实现高阶传播,将每一层输出的嵌入表示作为下一层的输入,然后通过加权平均信息构建和拼接聚合操作后使用非线性激活函数对嵌入表示进行非线性变换;在第l层的传播后专家节点的嵌入向量和关键词节点的嵌入向量/>可表示为:
其中第l层专家r接收来自邻居节点的信息和关键词k接收来自邻居节点信息/>定义如下:
其中,表示在第l层中消息构建所使用的权重矩阵,/>和/>表示上一层消息传递中生成嵌入表示,Nr和Nk分别表示专家和关键词邻居的个数;
在关键词与关键词共现图结构中堆叠n个图注意力层实现高阶传播,将每一层输出的嵌入表示作为下一层的输入,然后通过注意力机制进行信息构建和拼接聚合操作后使用非线性激活函数对嵌入表示进行非线性变换;关键词节点在第l层的传播后节点的嵌入向量可表示为:
其中第l层关键词q接收来自邻居节点的信息定义如下:
其中,表示在第l层中消息构建所使用的权重矩阵,W表示可训练参数矩阵,/>表示上一层消息传递中生成的专家嵌入表示,apq表示节点的注意力系数;
经过n层传播后,每个节点可得到多个嵌入表示,为专家节点的多个嵌入表示,/>和/>是从两种图结构中得到的关键词嵌入表示,在不同层中获得的嵌入表示强调的是不同连接路径的消息,它们反应的是不同的上下文信息,将不同层中获得的嵌入表示融合在一起形成最终表征,使用连接操作,具体公式定义如下:
其中,表示专家表征,/>与/>分别表示在关键词与专家二分图结构和关键词与关键词共现图结构中的关键词表征。
5.根据权利要求1所述的基于多图神经网络的学位论文评审专家推荐方法,其特征在于,步骤(5)的具体实现方法为:
首先将两种图结构输出的嵌入表示进行连接操作,单个关键词最终的嵌入表示定义如下:
根据给定的关键词集合ks,将对应的关键词嵌入表示通过向量堆叠操作得到矩阵Eks,对矩阵Eks进行平均池化操作得到MLP的输入嵌入表示eks;将向量eks输入到具有两层的MLP,在MLP的非线性学习能力下捕获关键词之间的关联性,最终输出多个关键词融合的整体表征emks,定义如下:
et=ReLU(W1·Avg(Eks)+b1)
emks=ReLU(W2et+b2)
其中,Avg(Eks)表示对矩阵进行平均池化操作,et表示第一层输出的向量,W1,b1,W2,W2分别表示用于线性变换使用的第一层和第二层的可训练的参数。
6.根据权利要求1所述的基于多图神经网络的学位论文评审专家推荐方法,其特征在于,步骤(6)的具体实现方法为:
通过对关键词表征与专家的表征/>进行内积操作来预测关键词与专家之间的相似度/>
然后通过构建所有专家的表征矩阵ER,与关键词表征进行内积交互操作,输出为关键词与所有专家的相似度向量定义如下:
最后通过对相似度向量进行排序,输出排序前K的专家为最终的推荐结果resks;
其中,argsort(·)表示根据向量值排序输出索引向量的函数,K表示自定义参数,TopK表示输出向量中前K个值的函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410028509.0A CN117763238B (zh) | 2024-01-09 | 2024-01-09 | 基于多图神经网络的学位论文评审专家推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410028509.0A CN117763238B (zh) | 2024-01-09 | 2024-01-09 | 基于多图神经网络的学位论文评审专家推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117763238A CN117763238A (zh) | 2024-03-26 |
CN117763238B true CN117763238B (zh) | 2024-05-24 |
Family
ID=90325731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410028509.0A Active CN117763238B (zh) | 2024-01-09 | 2024-01-09 | 基于多图神经网络的学位论文评审专家推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117763238B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113516094A (zh) * | 2021-07-28 | 2021-10-19 | 中国科学院计算技术研究所 | 一种用于为文档匹配评议专家的系统以及方法 |
CN114662652A (zh) * | 2022-02-21 | 2022-06-24 | 石家庄铁道大学 | 一种基于多模态信息学习的专家推荐方法 |
WO2023039901A1 (zh) * | 2021-09-18 | 2023-03-23 | 京东方科技集团股份有限公司 | 一种文本推荐方法、模型训练方法、装置及可读存储介质 |
CN116610807A (zh) * | 2023-07-21 | 2023-08-18 | 北京语言大学 | 一种基于异质图神经网络的知识结构识别方法及装置 |
CN117093670A (zh) * | 2023-07-18 | 2023-11-21 | 北京智信佳科技有限公司 | 一种论文智能推荐专家的实现方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254803B (zh) * | 2021-06-24 | 2021-10-22 | 暨南大学 | 一种基于多特征异质图神经网络的社交推荐方法 |
-
2024
- 2024-01-09 CN CN202410028509.0A patent/CN117763238B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113516094A (zh) * | 2021-07-28 | 2021-10-19 | 中国科学院计算技术研究所 | 一种用于为文档匹配评议专家的系统以及方法 |
WO2023039901A1 (zh) * | 2021-09-18 | 2023-03-23 | 京东方科技集团股份有限公司 | 一种文本推荐方法、模型训练方法、装置及可读存储介质 |
CN114662652A (zh) * | 2022-02-21 | 2022-06-24 | 石家庄铁道大学 | 一种基于多模态信息学习的专家推荐方法 |
CN117093670A (zh) * | 2023-07-18 | 2023-11-21 | 北京智信佳科技有限公司 | 一种论文智能推荐专家的实现方法 |
CN116610807A (zh) * | 2023-07-21 | 2023-08-18 | 北京语言大学 | 一种基于异质图神经网络的知识结构识别方法及装置 |
Non-Patent Citations (4)
Title |
---|
Multiview Graph Convolutional Hashing for Multisource Remote Sensing Image Retrieval;Jian Gao等;IEEE Geoscience and Remote Sensing Letters;20210715;全文 * |
一种面向主题覆盖度与权威度的评审专家推荐模型研究;赵千;耿骞;靳健;韦娱;;图书情报工作;20170105(第01期);全文 * |
基于图计算的论文审稿自动推荐系统;谢玮;沈一;马永征;;计算机应用研究;20161231(第03期);全文 * |
基于深度神经网络的在线协作学习交互文本分类方法;甄园宜;郑兰琴;;现代远程教育研究;20200525(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117763238A (zh) | 2024-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112989064B (zh) | 一种聚合知识图神经网络和自适应注意力的推荐方法 | |
CN109190030B (zh) | 融合node2vec和深度神经网络的隐式反馈推荐方法 | |
CN112905900A (zh) | 基于图卷积注意力机制的协同过滤推荐算法 | |
CN111881350A (zh) | 一种基于混合图结构化建模的推荐方法与系统 | |
CN111143705A (zh) | 一种基于图卷积网络的推荐方法 | |
CN112417313A (zh) | 一种基于知识图卷积网络的模型混合推荐方法 | |
Lin et al. | Knowledge-enhanced recommendation using item embedding and path attention | |
Luo et al. | Deep semantic network representation | |
CN113342994A (zh) | 一种基于无采样协作知识图网络的推荐系统 | |
CN114139066A (zh) | 一种基于图神经网络的协同过滤推荐系统 | |
Chen et al. | Graph enhanced neural interaction model for recommendation | |
Yuan et al. | Wide and deep model of multi-source information-aware recommender system | |
CN117763238B (zh) | 基于多图神经网络的学位论文评审专家推荐方法 | |
CN112100486A (zh) | 一种基于图模型的深度学习推荐系统及其方法 | |
CN115631504A (zh) | 一种基于双模态图网络信息瓶颈的情感识别方法 | |
CN115545833A (zh) | 一种基于用户社交信息的推荐方法及系统 | |
CN115391555A (zh) | 一种用户感知的知识图谱推荐系统及方法 | |
Balasubramaniam et al. | People to people recommendation using coupled nonnegative boolean matrix factorization | |
CN114491055B (zh) | 基于知识图谱的推荐方法 | |
CN117520665B (zh) | 一种基于生成对抗网络的社交推荐方法 | |
Wang et al. | ALT: Towards Fine-grained Alignment between Language and CTR Models for Click-Through Rate Prediction | |
Thirunavukarasu et al. | People to people recommendation using coupled nonnegative Boolean matrix factorization | |
Kala et al. | Applicability of deep learning techniques in recommender systems | |
Wang et al. | 3MVGAT: Multi-Modal and Multi-View Knowledge Graph Attention Network for Recommendation Algorithm | |
Li et al. | K-PropNet: Knowledge-Enhanced Hybrid Heterogeneous Homogeneous Propagation Network for Recommender System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |