CN113268951B

CN113268951B - 一种基于深度学习的引文推荐方法

Info

Publication number: CN113268951B
Application number: CN202110479095.XA
Authority: CN
Inventors: 顾亦然; 周鹏; 张远之; 陈禹洲; 姚朱鹏; 顾超
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2021-04-30
Filing date: 2021-04-30
Publication date: 2023-05-30
Anticipated expiration: 2041-04-30
Also published as: CN113268951A

Abstract

本发明公开了一种基于深度学习的引文推荐方法，步骤如下：提取上下文、候选引文标题、摘要部分的关键词；使用BERT预训练模型对关键词进行处理，输出单词向量；建立GRU双向神经网络模型，对单词向量进行特征提取；引入注意力机制，将特征向量作为注意力机制的输入序列，输出候选引文集；引入时间衰减函数，根据引文发表时间及被引次数，对候选引文集进行处理，计算每个引文总得分值，按照总得分值进行排序，将排序结果推送给用户。本发明通过BERT预训练模型将单词向量化，再引入GRU双向神经网络模型和注意力机制，挖掘出与上下文相关联的引文进行推荐，根据文章发表时间和被引次数对推荐结果进一步筛选，提升了推荐引文的准确度。

Description

一种基于深度学习的引文推荐方法

技术领域

本发明涉及信息推荐领域，特别涉及一种基于深度学习的引文推荐方法。

背景技术

在科学文章写作过程中，通过引用现有文献来支撑自己观点是写作重要的一部分，随着大量文章涌现，写作人员往往需要花费很多时间在参差不齐的文章中寻找合适的参考文献，而引文推荐能够帮助写作人员快速找到合适的参考文献。

传统引文推荐方法包括基于内容的方法、基于图模型的方法以及基于主题模型的方法。基于内容的方法仅仅通过提取关键词来匹配相关联内容，但存在语义模糊的缺点；基于图模型的方法运用数据集中文章的各项信息来建立图模型，通过分析文章之间相关性进行推荐，但并未考虑文章中词与上下文之间的关联；基于主题模型的方法通过分析单词的概率分布提取全文主题，根据主题推荐引文，但缺少对文章上下文语义的分析。

发明内容

发明目的：针对以上问题，本发明目的是提供一种基于深度学习的引文推荐方法，利用BERT预训练模型和双向GRU双向神经网络挖掘深层次语义信息，提高引文推荐效果。

技术方案：本发明的一种基于深度学习的引文推荐方法，步骤如下：

(1)提取文章上下文、候选引文标题、候选引文摘要这三部分的关键词；

(2)使用BERT预训练模型对三部分关键词进行数据处理，将关键词转化成单词向量；

(3)建立GRU双向神经网络模型，将单词向量作为双向神经网络模型的输入，将文章上下文单词向量和每个候选引文单词向量分别输入到双向神经网路模型中，利用双向神经网络模型对文章上下文单词向量和每个候选引文的单词向量分别进行特征提取，得到文章上下文单词特征向量和每个候选引文单词特征向量；

(4)引入注意力机制，将步骤3提取的特征向量作为注意力机制的输入序列，其中包括文章上下文单词特征向量和每个候选引文单词特征向量，在输入序列上引入注意权重，对上下文和每个候选引文之间的单词进行交互，得到上下文和每个候选引文之间关联信息的位置集，将位置集转化成每个候选引文的得分值，根据得分值从高到低对每个候选引文进行排序，输出第一次候选引文集；

(5)引入时间衰减函数，根据每个候选引文发表时间及被引次数，对步骤4第一次候选引文集进行处理，得到每个引文总得分值，按照总得分值进行排序，将排序结果推送给用户。

进一步，步骤1包括：利用TF-IDF算法提取关键词，TF表示词频，IDF表示逆文档频率，提取关键词之前先去除用户写作文章上下文、候选引文中标题、摘要这三部分中的停用词，提取关键词之后对重复的词语进行去重操作。

进一步，步骤2中BERT预训练模型进行处理后，得到高维单词向量，再使用双向编码器将高维单词向量映射到低维向量作为步骤3的输入。

进一步，步骤3中特征提取包括：GRU双向神经网络模型包括更新门和重置门，利用更新门输出前一时刻状态信息被带入当前时刻的程度，利用重置门去除前一时刻的无效信息，输出提取后的特征向量。

进一步，步骤5先计算每个候选引文集的引文热度，再根据引文热度计算每个引文的总得分值。

有益效果：本发明与现有技术相比，其显著优点是：本发明通过BERT预训练模型将单词向量化，清楚表示出语义信息；再引入GRU双向神经网络模型和注意力机制，挖掘出与文章上下文相关联的引文进行推荐，根据文章发表时间和被引次数对推荐结果进一步筛选，提升了推荐引文的准确度。

附图说明

图1为本发明的流程图。

具体实施方式

本实施例所述的一种基于深度学习的引文推荐方法，流程图如图1所示，步骤如下：

(1)去除文章上下文、候选引文中标题、候选引文摘要这三部分中的停用词，然后利用TF-IDF算法提取这三部分所有语句中的关键词，对提取到的关键词中重复的词语进行去重操作。

(2)使用BERT预训练模型分别对步骤1去重后的三部分关键词进行数据处理，将关键词转化成单词向量，由于得到的是高维单词向量，再使用双向编码器Transformer将高维单词向量映射到低维单词向量。

(3)建立GRU双向神经网络模型，将步骤2三部分低维单词向量分别输入到双向神经网络模型，单词向量包括每个句子的序列信息，根据序列信息利用神经网络模型对单词向量分别进行特征提取，输出文章上下文单词特征向量和候选引文单词特征向量。

GRU双向神经网络模型包括更新门和重置门，利用更新门输出前一时刻状态信息被带入当前时刻的程度，利用重置门去除前一时刻的无效信息，输出提取后的特征向量。

更新门计算公式为：

r_t＝σ(W_rx_t+W_rh_t-1+b_r)

其中σ表示激活函数，W_r是更新门中的权重矩阵，x_t表示当前时刻的输入，h_t-1分别表示前一时刻的隐层状态信息，b_r为更新门中的偏置量，r_t是更新门计算结果，表示需要重置信息的程度。

重置门计算公式为：

z_t＝σ(W_zx_t+W_zh_t-1+b_z)

其中W_z是重置门中的权重矩阵，b_z为重置门中的偏置量，z_t是更新门计算结果，表示需要更新信息的程度。

当前时刻状态信息计算过程公式为：

式中W_h是当前时刻权重矩阵，h_t-1表示上一时刻隐层状态信息，b_h为当前时刻偏置量，

是候选激活状态信息。首先计算候选引文中激活状态信息，然后利用上一时刻的隐层状态信息和候选激活状态信息计算当前时刻隐层状态信息。

经过GRU双向神经网络模型后输出特征向量表达式为：

y_t＝σ(W_oh_t)

其中W_o是GRU输出层中的权重矩阵，特征向量y_t表示能够保留下来文本语义特征，包括文章上下文语义特征和推荐引文语义特征。

(4)引入注意力机制，将步骤3提取的特征向量y_t包括文章上下文特征向量和推荐引文特征向量，作为注意力机制的输入序列

输入到注意力机制中，在输入序列上引入注意权重α。

注意力机制的计算表达式为：

其中α_ij为注意力机制中的分配系数，

是文章上下文和推荐引文的特征向量对应的语义编码，内容特征向量c_j是编码器所有隐藏状态信息及其相应分配系数的加权和，i,j表示上一层输入序列的下标和注意力机制中解码位置下标，n为步骤三中经过GRU输出的向量数量。

对上下文及每个候选引文之间的单词进行交互，计算单词之间的匹配度，挖掘文本之间的关系，得到上下文及候选引文之间关联信息的位置集，经过softmax层后得到每个引文的得分值y，表达式为：

根据每个引文得分值从高到低对候选引文进行排序，选出Top-N个引文作为第一次候选引文集。

(5)引入时间衰减函数，根据引文发表时间及被引次数，对步骤4选出来的第一次候选引文集利用函数计算每个引文的引文热度，函数表达式为：

其中，λ为衰减因子，取-1/10，t为当前年份，t₀为文章发表年份，k为引用次数。

再根据引文热度计算每个引文的总得分值，表达式为：

其中，s_max为候选引文集中热度最高的分值。

按照总得分值进行排序，将排序结果推送给用户，用户根据排序结果选择与当前上下文相关的引文。

Claims

1.一种基于深度学习的引文推荐方法，其特征在于，步骤如下：

2.根据权利要求1所述的引文推荐方法，其特征在于，步骤1包括：利用TF-IDF算法提取关键词，TF表示词频，IDF表示逆文档频率，提取关键词之前先去除用户写作文章上下文、候选引文中标题、摘要这三部分中的停用词，提取关键词之后对重复的词语进行去重操作。

3.根据权利要求1所述的引文推荐方法，其特征在于，步骤2中BERT预训练模型进行处理后，得到高维单词向量，再使用双向编码器将高维单词向量映射到低维向量作为步骤3的输入。

4.根据权利要求3所述的引文推荐方法，其特征在于，步骤3中特征提取包括：GRU双向神经网络模型包括更新门和重置门，利用更新门输出前一时刻状态信息被带入当前时刻的程度，利用重置门去除前一时刻的无效信息，输出提取后的特征向量。

5.根据权利要求4所述的引文推荐方法，其特征在于，步骤5先计算每个候选引文集的引文热度，再根据引文热度计算每个引文的总得分值。