CN112364151A - 一种基于图、引文和内容的论文混合推荐方法 - Google Patents

一种基于图、引文和内容的论文混合推荐方法 Download PDF

Info

Publication number
CN112364151A
CN112364151A CN202011156053.4A CN202011156053A CN112364151A CN 112364151 A CN112364151 A CN 112364151A CN 202011156053 A CN202011156053 A CN 202011156053A CN 112364151 A CN112364151 A CN 112364151A
Authority
CN
China
Prior art keywords
similarity
citation
quotation
paper
papers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011156053.4A
Other languages
English (en)
Other versions
CN112364151B (zh
Inventor
吴奇石
康颖
侯爱琴
赵子民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern University
Original Assignee
Northwestern University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern University filed Critical Northwestern University
Priority to CN202011156053.4A priority Critical patent/CN112364151B/zh
Publication of CN112364151A publication Critical patent/CN112364151A/zh
Application granted granted Critical
Publication of CN112364151B publication Critical patent/CN112364151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图、引文和内容的论文混合推荐方法,通过引文关系构建有向引文图来查找相关论文集,并结合基于引文与基于内容的方法来计算论文之间的相似度,按照混合模型产生的相似度对相关论文集进行排序和推荐。考虑到不同章节的引用重要性不同,对基于引文的方法进行了改进,提出了基于章节的引文相似度,对不同章节的引文分配不同的权重,从而提高推荐的准确性。

Description

一种基于图、引文和内容的论文混合推荐方法
技术领域
本发明属于推荐系统领域,涉及一种基于图、引文和内容的论文混合推荐方法。
背景技术
在科研工作中,研究者往往需要阅读大量论文,但随着论文网站中论文数量的增多,用户很难通过关键词搜索到自己感兴趣的论文。因此需要更好的论文推荐方法来为用户推荐论文。
论文推荐方法主要基于论文的基本信息,包括关键词、摘要、作者和引文等。已有的方法中,基于引用的推荐方法被广泛应用。如通过直接引用关系建立评分矩阵,然后采用协同过滤方法推荐论文。但随着论文的增多,基于协同过滤的方法存在冷启动和稀疏矩阵的问题。除协同过滤外,引文分析也是基于引用的一个重要应用。引文分析主要通过分析引文关系进行推荐,引文关系分为直接引用、文献耦合、共被引等,其中文献耦合和共被引关系在论文推荐中表现出较高的逻辑相关性。论文是主要是文本信息,因此也有很多方法基于关键词、摘要等内容进行推荐,但由于pdf文本抽取技术的困难以及大量文本计算的耗时,基于内容的方法通常表现的性能不是非常好。此外基于图的方法也十分常用,通过引文、关键词、主题、作者或用户信息之间的联系建立一个图结构来推荐论文,如何更好的组织利用这些信息仍需要更多的研究。
由于单一方法都存在一些缺陷,并且不利于推荐的多样性,目前越来越多的方法采用混合模型来推荐论文,并且结果表明,混合模型的性能远远好于单一方法。
发明内容
针对现有技术中单一方法的不足,本发明的目的在于,提供一种基于图、引文和内容推荐的混合推荐方法。
为了实现上述任务,本发明采取如下的技术解决方案:
一种基于图、引文和内容的论文混合推荐方法,其特征在于,具体实现步骤如下:
步骤一,有向引文图构建
对当前进行推荐的论文,即目标论文通过引文关系构建有向引文图来生成相关论文集;引文关系包括直接引文和间接引文,其中,间接引文包括文献耦合、共被引结构;所述有向引文图结构包括有多个节点,每个节点代表一篇论文,两个节点之间的边表示引用关系,有+1、-1两种类型的边,+1表示引用,-1表示被引;
通过有向引文图获取相关论文集有两个步骤:
1)直接引用的节点通过一条边到达;
2)间接引用的节点通过两条边到达;
一个目标论文的相关论文集被表示为:
RP(t)={(r1,sim1,p1),(r2,sim2,p2),...,(ri,simi,pi),...}(0<i≤n)
其中,t是目标论文,t的相关论文个数为n,ri为相关论文,simi为ri与t之间的相似度,pi为由t到ri的路径之和,所有的相关论文的相似度初始为0;
步骤二,基于章节的引文相似度
从论文中提取引用所在章节,由于每篇论文的章节结构都不同,需要将所有的论文章节映射到一个通用的章节结构,并对章节分配权重;基于章节的引文相似度计算如下:
Figure BDA0002742773290000031
式中,w(edge)表示边的权重,即引文所在章节的权重;
引文相似度的计算由路径之和pi分为两种情况:
一种情况是pi=+1or-1,即直接引用,引文相似度为两个节点之间边的权重值;
另一种情况是pi=0,±2,即间接引用,引文相似度由第一条边权重w(edge1)与第二条边权重w(edge2)共同计算得来;
步骤三,内容相似度
内容相似度采用余弦相似度计算两篇论文的关键词之间的相似度,如下式所示:
Figure BDA0002742773290000032
式中,A表示相关论文ri关键词词频的词向量,B表示整个相关论文集的关键词词频的词向量;
步骤四,混合相似度
混合相似度即为引文相似度与内容相似度之和,用下式表示:
simi=simi(citaion)+simi(content)
最终通过混合相似度对相关论文集进行排序,生成的论文列表即为推荐结果。
本发明的基于图、引文和内容的论文混合推荐方法,对现有的不同的论文推荐方法优点如下:
1、通过有向引文图可以得到直接引用、文献耦合、共被引及其他间接引用,候选的相关论文包含的引文更加全面,提高了推荐的多样性;
2、针对基于引用的方法提出改进,提出了基于章节位置的引用相似度,对不同章节的引用分配不同的权重,再通过权重进一步计算引用相似度,从而更加准确的衡量引用相关性;
3、针对单一方法的不足,提出了混合方法,将引用相似度与内容相似度结合得到混合相似度,利用混合相似度对相关论文集进行排序,提高推荐的准确性,为用户推荐更加相关的论文。
附图说明
图1为论文推荐混合模型的框架图。
图2为有向引文图结构的一个简单示例图。
图3为目标论文的相关论文个数的统计图。
图4为采用本发明的基于图、引文和内容推荐的混合推荐方法在CiteSeer数据集上的spearman相关系数图。
图5为传统的基于章节的引文相似度推荐方法和基于引文推荐方法在CiteSeer数据集上的对比图。
图6为本发明的基于图、引文和内容的论文混合推荐方法和基于章节的引文相似度推荐方法在CiteSeer数据集上的对比图。
图7为本发明的基于图、引文和内容的论文混合推荐方法、基于引文推荐方法和基于章节在的引文相似度推荐方法CiteSeer数据集上的整体对比图。
图8为本发明的基于图、引文和内容推荐的混合推荐方法、基于引文推荐方法和基于章节的引文相似度推荐方法在CiteSeer数据集上的平均spearman相关系数值对比图。
图9为本发明的基于图、引文和内容的论文混合推荐方法在万方数据集上的spearman相关系数图。
图10为本发明的基于图、引文和内容推荐的混合推荐方法、基于引文推荐方法、基于章节的引文相似度推荐方法和基于内容的推荐方法在万方数据集上的整体对比图。
具体实施方式
本发明的基于图、引文和内容推荐的混合推荐方法,通过引文关系构建有向引文图来查找相关论文集,并结合基于引文与基于内容的方法来计算论文之间的相似度,按照混合模型产生的相似度对相关论文集进行排序和推荐。考虑到不同章节的引用重要性不同,对基于引文的方法进行了改进,提出了基于章节的引文相似度,对不同章节的引文分配不同的权重,从而提高推荐的准确性。并采用了以下算法:
1)通过引文关系构建有向引文图,该有向引文图与引文网络结构相似,但具有加权的边及有限的步长,利用有向引文图可得到目标论文的相关论文集;
2)考虑到引文的所在章节位置,提出基于章节的引用相似度。传统的基于引用的方法通常采用1或0来表示两篇论文之间是否存在引用关系,然而,若使用1或0表示引用相似度不够准确,并且不同章节的引文的重要性不同。因此,本发明对现有的基于引用的方法做出了改进,提出基于章节的引用相似度;
3)通过论文的关键词计算内容相似度,将引文相似度与内容相似度相加得到混合相似度,对相关论文集排序进行推荐。
本实施例给出一种基于图、引文和内容的论文混合推荐方法,采用的论文推荐混合模型的框架如图1所示,首先通过有向引文图寻找相关论文集,然后利用引文的章节位置及关键词分别计算引文相似度和内容相似度,最终得到混合相似度来推荐论文。具体实现步骤如下:
步骤一,构建有向引文图:
对当前进行推荐的论文,即目标论文通过引文关系构建有向引文图来生成相关论文集。引文关系包括直接引文和间接引文,其中,间接引文包括文献耦合、共被引结构等。
有向引文图结构如图2所示,每个节点代表一篇论文,两个节点之间的边表示引用关系,有+1、-1两种类型的边,+1表示引用,-1表示被引。例如,对于图2中的目标论文节点A,由A指向B的边是+1,表示A引用了B;由C指向A的边为-1,表示A被C引用。也就是说,从节点A开始,通过边+1即可到达B节点,通过边-1即可到达C节点。
通过有向引文图获取相关论文集有两个步骤:
1)直接引用的节点通过一条边到达,例如,图2中,目标论文节点A分别通过+1或-1到候选论文达节点B或C;
2)间接引用的节点通过两条边到达,例如,图2中,节点A经过(+1,+1)、(+1,-1)、(-1,-1)、(-1,+1)分别得到节点D、E、F、G。经过两个步骤后,目标论文A的相关论文为候选论文(B、C、D、E、F和G)。
在本实施例中,一个目标论文的相关论文集被表示为:RP(t)={(r1,sim1,p1),(r2,sim2,p2),...,(ri,simi,pi),...}(0<i≤n),其中,t是目标论文,t的相关论文个数为n,ri为相关论文,simi为ri与t之间的相似度,pi为由t到ri的路径之和,如图2中,从目标论文节点A到候选论文节点D的路径是(+1,+1),该路径的和为两条边之和+2。
因此,最终目标论文节点A的相关论文集为RP(A)={(B,0,+1),(C,0,-1),(D,0,+2),(E,0,0),(F,0,-2),(G,0,0)},所有的相关论文的相似度初始为0。
步骤二,基于章节的引文相似度:
从论文中提取引用所在章节,首先从CiteSeer论文网站上爬取论文pdf文档,使用PDFx工具将pdf转化为XML格式,XML文档带有章节及引用的标签,可直接提取章节及引用信息。部分论文不能转化为XML格式,通过正则匹配进行信息提取,最终能够准确处理绝大部分pdf。
由于每篇论文的章节结构都不同,需要将所有的论文章节映射到一个通用的章节结构,根据已有研究,通用的五个章节如表1所示。已有研究证明了各章节权重的关系,如下所示:
wMethodology/wResult>wIntroduction>wRelated Work
然后对章节分配权重,如表1所示,其中结论章节几乎没有引文,未分配权重。
表1
Figure BDA0002742773290000071
基于章节的引文相似度计算如下:
Figure BDA0002742773290000072
式中,w(edge)表示边的权重,即引文所在章节的权重。引文相似度的计算由路径之和pi分为两种情况,首先是pi=+1or-1,即直接引用,引文相似度为两个节点之间边的权重值;另一种情况是pi=0,±2,即间接引用,引文相似度由第一条边权重w(edge1)与第二条边权重w(edge2)共同计算得来。
步骤三,内容相似度:
在一个章节中往往不止一个引用,仅使用引文相似度会出现多个论文相似度相同的情况,因此引入内容相似度,以提高推荐的准确性。内容相似度采用余弦相似度计算两篇论文的关键词之间的相似度,如下式所示:
Figure BDA0002742773290000081
式中,A表示相关论文ri关键词词频的词向量,B表示整个相关论文集的关键词词频的词向量。
步骤四,混合相似度:
混合相似度即为引文相似度与内容相似度之和:
simi=simi(citaion)+simi(content)
最终通过相似度对相关论文集进行排序,生成的论文列表即为推荐结果。
实验验证例:
为了验证本实施例的基于图、引文和内容的论文混合推荐方法的性能,采用spearman相关系数来评估推荐结果,推荐结果即为一个按照相关度排序的论文列表。将JensenShannon divergence(JSD)方法对论文文本计算得到的相关度排序作为基准,JSD计算的是两个单词分布概率之间的距离,在本实施例中分别是相关论文的单词分布概率和整个相关论文集的单词分布概率,然后通过相关论文的JSD值进行排序。最后通过spearman系数计算混合模型得到的推荐列表与JSD得到的列表之间的相关系数来评估本发明的混合模型。为了JSD更准确的衡量论文间的相关度,JSD对论文的整个文本进行计算,但处理过程非常耗时,平均处理100个pdf文档需要近半个小时,相比之下,本实施例的基于图、引文和内容的论文混合推荐方法,只需处理从XML文档中提取的信息,花费的时间非常少。
(1)CiteSeer数据集上的评估
首先在CiteSeer数据集上进行实验,共有1100篇文献,其中有18篇目标论文。为了便于观察实验结果,根据每篇目标论文的相关论文集中的论文个数,将18篇目标论文分为了10组。图3是对论文分组的统计,x轴为相关论文集中论文个数的范围,y轴为目标论文的数量。
将本实施例的基于图、引文和内容的论文混合推荐方法与已知的几个方法进行了对比,图4是10组目标论文在本实施例的基于图、引文和内容的论文混合推荐方法下的平均spearman相关系数值,所有的论文的平均相关系数值为0.77。图5为基于章节的引文相似度方法与未区分章节位置的传统的基于引文方法的对比图,可以明显的看到区分章节的引文相似度能够提高推荐的准确度。为了评估混合模型比单一模型的优势,在图6中对本实施例的基于图、引文和内容的论文混合推荐方法与基于章节的引文方法进行了对比,结果显示在大多情况下,本实施例的基于图、引文和内容的论文混合推荐方法优于单一的引文方法。图7和图8是对三个方法的整体比较,图8中可以看出,本实施例给出的基于图、引文和内容的论文混合推荐方法比传统的基于引文的方法相关性提高了40%。
(2)万方数据集上的评估
针对中文论文也进行了评估,从万方论文网站收集了约500篇论文,根据5篇目标论文分为了5组。图9给出了采用混合模型的推荐结果评估,所有论文的平均相关系数为0.73。并将本实施例的基于图、引文和内容的论文混合推荐方法与基于章节的引用方法、基于引用的方法、基于内容的方法进行了对比,结果如图10所示,可以看出本实施例的基于图、引文和内容的论文混合推荐方法的性能优于其他三种方法。

Claims (1)

1.一种基于图、引文和内容的论文混合推荐方法,其特征在于,具体实现步骤如下:
步骤一,有向引文图构建
对当前进行推荐的论文,即目标论文通过引文关系构建有向引文图来生成相关论文集;引文关系包括直接引文和间接引文,其中,间接引文包括文献耦合、共被引结构;所述有向引文图结构包括有多个节点,每个节点代表一篇论文,两个节点之间的边表示引用关系,有+1、-1两种类型的边,+1表示引用,-1表示被引;
通过有向引文图获取相关论文集有两个步骤:
1)直接引用的节点通过一条边到达;
2)间接引用的节点通过两条边到达;
一个目标论文的相关论文集被表示为:
RP(t)={(r1,sim1,p1),(r2,sim2,p2),...,(ri,simi,pi),...}(0<i≤n)
其中,t是目标论文,t的相关论文个数为n,ri为相关论文,simi为ri与t之间的相似度,pi为由t到ri的路径之和,所有的相关论文的相似度初始为0;
步骤二,基于章节的引文相似度
从论文中提取引用所在章节,由于每篇论文的章节结构都不同,需要将所有的论文章节映射到一个通用的章节结构,并对章节分配权重;基于章节的引文相似度计算如下:
Figure FDA0002742773280000011
式中,w(edge)表示边的权重,即引文所在章节的权重;
引文相似度的计算由路径之和pi分为两种情况:
一种情况是pi=+1or-1,即直接引用,引文相似度为两个节点之间边的权重值;
另一种情况是pi=0,±2,即间接引用,引文相似度由第一条边权重w(edge1)与第二条边权重w(edge2)共同计算得来;
步骤三,内容相似度
内容相似度采用余弦相似度计算两篇论文的关键词之间的相似度,如下式所示:
Figure FDA0002742773280000021
式中,A表示相关论文ri关键词词频的词向量,B表示整个相关论文集的关键词词频的词向量;
步骤四,混合相似度
混合相似度即为引文相似度与内容相似度之和,用下式表示:
simi=simi(citaion)+simi(content)
最终通过混合相似度对相关论文集进行排序,生成的论文列表即为推荐结果。
CN202011156053.4A 2020-10-26 2020-10-26 一种基于图、引文和内容的论文混合推荐方法 Active CN112364151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011156053.4A CN112364151B (zh) 2020-10-26 2020-10-26 一种基于图、引文和内容的论文混合推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011156053.4A CN112364151B (zh) 2020-10-26 2020-10-26 一种基于图、引文和内容的论文混合推荐方法

Publications (2)

Publication Number Publication Date
CN112364151A true CN112364151A (zh) 2021-02-12
CN112364151B CN112364151B (zh) 2023-06-27

Family

ID=74512169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011156053.4A Active CN112364151B (zh) 2020-10-26 2020-10-26 一种基于图、引文和内容的论文混合推荐方法

Country Status (1)

Country Link
CN (1) CN112364151B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113158041A (zh) * 2021-04-19 2021-07-23 电子科技大学 一种基于多属性特征的文章推荐方法
CN113505216A (zh) * 2021-07-07 2021-10-15 辽宁工程技术大学 一种基于引用图的多特征论文推荐方法
CN116628350A (zh) * 2023-07-26 2023-08-22 山东大学 基于可区分主题的新论文推荐方法和系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110219017A1 (en) * 2010-03-05 2011-09-08 Xu Cui System and methods for citation database construction and for allowing quick understanding of scientific papers
US20110264672A1 (en) * 2009-01-08 2011-10-27 Bela Gipp Method and system for detecting a similarity of documents
WO2012118087A1 (ja) * 2011-03-03 2012-09-07 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
CN105653706A (zh) * 2015-12-31 2016-06-08 北京理工大学 一种基于文献内容知识图谱的多层引文推荐方法
WO2018090344A1 (en) * 2016-11-18 2018-05-24 Microsoft Technology Licensing, Llc. Search engine based on citation
WO2018108004A1 (en) * 2016-12-16 2018-06-21 Huawei Technologies Co., Ltd. Predictive table pre-joins in large scale data management system using graph community detection
CN109145087A (zh) * 2018-07-30 2019-01-04 大连理工大学 一种基于表示学习和竞争理论的学者推荐及合作预测方法
CN110083703A (zh) * 2019-04-28 2019-08-02 浙江财经大学 一种基于引用网络和文本相似度网络的文献聚类方法
CN110083696A (zh) * 2019-04-23 2019-08-02 安徽大学 基于元结构技术的全局引文推荐方法、推荐系统
CN110674318A (zh) * 2019-08-14 2020-01-10 中国科学院计算机网络信息中心 一种基于引文网络社区发现的数据推荐方法
CN110688474A (zh) * 2019-09-03 2020-01-14 西北工业大学 基于深度学习与链接预测的嵌入表示获得及引文推荐方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264672A1 (en) * 2009-01-08 2011-10-27 Bela Gipp Method and system for detecting a similarity of documents
US20110219017A1 (en) * 2010-03-05 2011-09-08 Xu Cui System and methods for citation database construction and for allowing quick understanding of scientific papers
WO2012118087A1 (ja) * 2011-03-03 2012-09-07 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
CN105653706A (zh) * 2015-12-31 2016-06-08 北京理工大学 一种基于文献内容知识图谱的多层引文推荐方法
WO2018090344A1 (en) * 2016-11-18 2018-05-24 Microsoft Technology Licensing, Llc. Search engine based on citation
WO2018108004A1 (en) * 2016-12-16 2018-06-21 Huawei Technologies Co., Ltd. Predictive table pre-joins in large scale data management system using graph community detection
CN109145087A (zh) * 2018-07-30 2019-01-04 大连理工大学 一种基于表示学习和竞争理论的学者推荐及合作预测方法
CN110083696A (zh) * 2019-04-23 2019-08-02 安徽大学 基于元结构技术的全局引文推荐方法、推荐系统
CN110083703A (zh) * 2019-04-28 2019-08-02 浙江财经大学 一种基于引用网络和文本相似度网络的文献聚类方法
CN110674318A (zh) * 2019-08-14 2020-01-10 中国科学院计算机网络信息中心 一种基于引文网络社区发现的数据推荐方法
CN110688474A (zh) * 2019-09-03 2020-01-14 西北工业大学 基于深度学习与链接预测的嵌入表示获得及引文推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZHUOREN JIANG等: "Cross-language Citation Recommendation via Hierarchical Representation Learning on Heterogeneous Graph", 《SIGIR "18: THE 41ST INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH & DEVELOPMENT IN INFORMATION RETRIEVAL》 *
潘峰等: "基于分布式图计算的学术论文推荐算法", 《计算机应用研究》 *
石杰等: "一种基于多因素的引文推荐方法", 《计算机研究与发展》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113158041A (zh) * 2021-04-19 2021-07-23 电子科技大学 一种基于多属性特征的文章推荐方法
CN113158041B (zh) * 2021-04-19 2022-07-29 电子科技大学 一种基于多属性特征的文章推荐方法
CN113505216A (zh) * 2021-07-07 2021-10-15 辽宁工程技术大学 一种基于引用图的多特征论文推荐方法
CN116628350A (zh) * 2023-07-26 2023-08-22 山东大学 基于可区分主题的新论文推荐方法和系统
CN116628350B (zh) * 2023-07-26 2023-10-10 山东大学 基于可区分主题的新论文推荐方法和系统

Also Published As

Publication number Publication date
CN112364151B (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
CN112364151B (zh) 一种基于图、引文和内容的论文混合推荐方法
US8341159B2 (en) Creating taxonomies and training data for document categorization
Pereira et al. Using web information for author name disambiguation
Lakkaraju et al. Document similarity based on concept tree distance
CN106599054B (zh) 一种题目分类及推送的方法及系统
CN110674318A (zh) 一种基于引文网络社区发现的数据推荐方法
CN108647322B (zh) 基于词网识别大量Web文本信息相似度的方法
CN107463616B (zh) 一种企业信息分析方法及系统
CN107391921B (zh) 一种科学文献中参考文献影响力评估方法
CN106055539A (zh) 姓名消歧的方法和装置
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
Ma et al. Bibliographic coupling: a main path analysis from 1963 to 2020
Zehtab-Salmasi et al. FRAKE: fusional real-time automatic keyword extraction
Zhu et al. An Incremental Approach for MEDLINE MeSH Indexing.
Kang et al. A hybrid approach for paper recommendation
Wang et al. A semantic query expansion-based patent retrieval approach
Wu et al. Searching online book documents and analyzing book citations
Shahid et al. Extension of Direct Citation Model Using In-Text Citations.
Triwijoyo et al. Analysis of Document Clustering based on Cosine Similarity and K-Main Algorithms
Tomita et al. Calculating similarity between texts using graph-based text representation model
CN114580557A (zh) 基于语义分析的文献相似度确定方法及装置
Singh et al. A meta search approach to find similarity between web pages using different similarity measures
Fenlon et al. A preliminary evaluation of HathiTrust metadata: Assessing the sufficiency of legacy records
Atlam A new approach for text similarity using articles
Cai An information-theoretic foundation for the measurement of discrimination information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant