CN108763328B

CN108763328B - 一种基于黄金引用算法的论文推荐方法

Info

Publication number: CN108763328B
Application number: CN201810432225.2A
Authority: CN
Inventors: 吴晨生; 杜丽萍; 李梦辉; 刘静; 黄裕荣
Original assignee: BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Current assignee: BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Priority date: 2018-05-08
Filing date: 2018-05-08
Publication date: 2019-05-14
Anticipated expiration: 2038-05-08
Also published as: CN108763328A

Abstract

本发明公开了一种基于黄金引用算法的论文推荐方法，包括以下步骤：首先，在论文数据库中选定论文群体范围；其次，依据所选定论文群体中论文的相互引用关系构建初始引用网络模型；然后，标定初始引用网络模型中论文的引用属性，并通过自引系数修订引用次数，生成自引修订论文群体；最后，迭代的缩小自引修订论文群体的范围，直至结果收敛，得出黄金引用论文。通过标定论文的引用属性，排除论文引用关系中自引的干扰，再依据自引修订引用次数，递归地缩小论文群体，排除低质低效他引论文的干扰，使得用户快速、准确的检索到高质量论文。

Description

一种基于黄金引用算法的论文推荐方法

技术领域

本发明属于大数据论文检索推荐技术领域，具体地说涉及一种基于黄金引用算法的论文推荐方法。

背景技术

基于推荐信息的不同，论文推荐主要分为基于内容的推荐，基于协同过滤的推荐，社会化推荐和混合模型推荐。在论文的推荐系统当中，还存在着一种特殊的基于引用的推荐，但从数量庞大、良莠不齐的文献资料中获取具有较高质量的科技论文是一项非常困难的工作，如何有效的自动评估科技论文质量成为了研究课题。被引次数是一项客观且直观的衡量论文质量的指标，论文引用包括作者在后来的论文中自我引用和他人的引用两种，自引次数的多少与论文的质量评估关系不大，而在统计引用次数时并不对二者做出区分，这是利用引用次数对科技论文进行评价时的一个局限性。同时，各个论文的诸多施引论文不能认为具有同等的质量或影响力，使得论文的被引次数无法完全体现论文质量。

现有技术中，基于论文引用次数提出了h指数、g指数，用于评估研究人员的学术产出数量与学术产出水平，但其排序的基础数据并没有进行处理，在实际应用中不能准确地反映真实情况。被引频次标准化虽然消除学科领域、文献类型、出版时间等因素的影响，实现跨学科或跨领域的比较，但统计数据庞大且计算繁琐，科研工作者或文献研究工作者无法快速识别某一领域或学科的关键论文群。

现有技术公开了一种基于引用关系分布式表达的论文推荐方法，利用分布式向量来表达论文在权重引用网络当中的上下文，然后利用该向量计算论文之间的相似度，达到论文推荐的目的。该申请只考虑了论文之间引用的相似度或论文内容的相似度，但并不能完全体现论文的质量。

有鉴于此特提出本发明。

发明内容

本发明要解决的技术问题在于克服现有技术的不足，提供一种基于黄金引用算法的论文推荐方法，通过黄金引用算法排除自引论文和低质低效的他引论文的干扰，使得用户可快速、准确的检索到高质量论文。

为解决上述技术问题，本发明采用技术方案的基本构思是：一种基于黄金引用算法的论文推荐方法，包括以下步骤：首先，在论文数据库中选定论文群体范围；其次，依据所选定论文群体中论文的相互引用关系构建初始引用网络模型；然后，标定初始引用网络模型中论文的引用属性，并通过自引系数修订引用次数，生成自引修订论文群体；最后，递归的缩小自引修订论文群体的范围，直至结果收敛，得出黄金引用论文。本申请中的黄金引用算法模型，排除了引用次数中的自引，从而避免了自引在论文评价中的干扰，又通过迭代删除的方式排除了引用次数统计中低质低效的他引干扰，提高了对高质量论文识别的准确性，并且该算法简单易于实行，用户运用该算法对论文群体中的高质量论文进行统计、计算较为方便。

进一步，所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文与论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系。

进一步，引入引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；

在论文群体G中以第i篇论文为节点的被引次数通过引用变量e_i,j累加得到，则建立第i篇论文在论文群体G中的被引次数关系式为其中，

进一步，所述标定论文引用属性，步骤如下：根据论文作者判定论文的引用关系是自引还是他引，若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引。

进一步，依据论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，i≥1，j≥1。

进一步，论文v_i被论文v_j引用且为自引，则引用变量e_i,j与自引系数λ_i,j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i,j的乘积为1；通过对引用变量e_i,j与自引系数λ_i,j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1。

进一步，依据自引修订引用次数为生成自引修订论文群体G'，从而构建出自引修订网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

进一步，引入被引次数设定值k，k依次由小到大取值，采用迭代删除的方式逐层缩小论文群体的范围，直至结果收敛，其中，k为整数，且k≥0。

进一步，第k层的初始论文群体为G^k时，G^k中含有|V^k|＝N_k个节点，即含有N_k篇论文，|E^k|＝M_k条边，第i篇论文在论文群体G^k中的被引次数关系式为

采用迭代的方式缩小G^k的范围，删除G^k中被引次数等于k的论文及其引用关系，生成论文群体G^k,1，第i篇论文在论文群体G^k,1中的被引次数关系式为继续删除G^k,1中小于和/或等于k的论文及其引用关系，并生成论文群体G^k,2，继续迭代删除，直至生成论文群体G^k,q，且G^k,q中论文被至少k+1篇G^k,q论文引用，形成第k+1层的初始论文群体，即G^k,q记作G^k+1；

每层迭代删除的论文组成论文群体D_k，删除后的论文群体G^k+1中含有|V^k+1|＝N_k+1个节点，即含有N_k+1篇论文，|E^k+1|＝M_k+1条边，第i篇论文在论文群体G^k+1中的被引次数关系式为且被引次数大于k，其中，k、q为整数，且k≥0，q≥1。

进一步，以自引修订论文群体G'为初始论文群体，G⁰＝G'，采用迭代删除的方式逐层缩小论文群体的范围，当k大于和/或等于n时，终止删除论文节点，论文群体收敛，得出黄金引用论文，其中n为整数，且n≥0，具体包括以下步骤：

S11.k＝0，删除G⁰中自引修订引用次数等于0的论文及其引用关系，生成论文群体G^0,1，第i篇论文在论文群体G^0,1中的被引次数关系式为继续删除G^0,1中等于0的论文及其引用关系，并生成论文群体G^0,2，继续迭代删除，直至生成论文群体G⁰ ^,q，且G^0,q中论文被其他至少1篇G^0,q中的论文引用，其中G^0,q记作G¹，迭代删除的论文组成论文群体D₀，论文群体缩小为G¹，G¹中含有|V¹|＝N₁个节点，即含有N₁篇论文，|E¹|＝M₁条边，第i篇论文在论文群体G¹中的被引次数关系式为其中，q为整数，且q≥1；

S12.k＝1，删除论文群体G¹中自引修订引用次数等于1的论文及其引用关系，生成论文群体G^1,1，第i篇论文在论文群体G^1,1中的被引次数关系式为继续删除G^1,1中小于和/或等于1的论文及其引用关系，并生成论文群体G^1,2，继续迭代删除，直至生成论文群体G^1,q，且G^1,q中论文被其他至少2篇G^1,q中的论文引用，其中G^1,q记作G²，迭代删除的论文组成论文群体D₁，论文群体缩小为G²，含有论文数量为|V²|＝N₂篇，第i篇论文在论文群体G²中的被引次数关系式为其中，q为整数，且q≥1；

S13.k＝2，删除G²中自引修订引用次数等于2的论文及其引用关系，生成论文群体G^2,1，第i篇论文在论文群体G^2,1中的被引次数关系式为继续删除G^2,1中小于和/或等于2的论文及其引用关系，并生成论文群体G^2,2，继续迭代删除，直至生成论文群体G^2,q，且G^2,q中论文被其他至少3篇G^2,q中的论文引用，其中G^2,q记作G³，迭代删除的论文组成论文群体为D₂，论文群体缩小为G³，含有论文数量为|V³|＝N₃篇，第i篇论文在论文群体G³中的被引次数关系式为其中，q为整数，且q≥1；

S14.依照步骤S11-S13，继续迭代删除边缘性论文，当k＝n时，删除Gⁿ中自引修订引用次数等于n的论文及其引用关系,生成论文群体G^n,1，第i篇论文在论文群体G^n,1中的被引次数关系式为继续删除G^n,1中小于和/或等于n的论文及其引用关系，并生成论文群体G^n,2，继续迭代删除，直至生成论文群体G^n,q，且G^n,q中论文被其他至少n+1篇G^n,q中的论文引用，其中G^n,q记作Gⁿ⁺¹，迭代删除的论文组成论文群体为D_n，论文群体缩小为Gⁿ⁺¹，则结果收敛，Gⁿ⁺¹含有论文数量为|Vⁿ⁺¹|＝N_n+1篇为黄金引用论文，其中n，q为整数，且n≥0，q≥1；

优选的，N_n-1-N_n小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，其中n为整数，且n≥0；

优选的，N_n小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，其中n为整数，且n≥0；

优选的，小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，其中n为整数，且n≥0。

论文的原始引用次数统计是将每次被引用记录均记为1，通过论文作者对引用关系进一步地限定，排除论文引用关系中自引的干扰，再根据施引论文的被引情况修订论文的引用次数，排除低质低效他引论文的干扰，采用迭代方式逐层地缩小了论文群体范围，使得用户快速、准确的检索到高质量论文；从而使得采用对论文引用次数评估获得高质量论文的方法更加合理。

采用上述技术方案后，本发明与现有技术相比具有以下有益效果：

1、通过构建论文群体初始引用网络模型，基于论文引用次数识别高质量论文，使得论文群中论文相互之间的引用关系更加具体直观，且计算过程快速便捷，选出的论文群体具有较高的权威性。

2、实施自引修订引用次数，排除了引用次数中的自引用论文，克服了自引在论文评价中的干扰，使得评估出的论文质量更加合理；同时，采用迭代删除的方式，排除自引修订引用次数统计中低质低效的他引干扰；综合考虑作者自引和低质量论文引用的干扰因素，对论文的初始的引用次数进行统计修订，提高推荐系统识别高质量论文的准确性。

下面结合附图对本发明的具体实施方式作进一步详细的描述。

附图说明

附图作为本发明的一部分，用来提供对本发明的进一步的理解，本发明的示意性实施例及其说明用于解释本发明，但不构成对本发明的不当限定。显然，下面描述中的附图仅仅是一些实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。在附图中：

图1是本发明中一种黄金引用论文算法的流程示意图；

图2是本发明中一种应用黄金引用论文算法的流程示意图；

图3是本发明中论文群体初始引用网络模型示意图；

图4是本发明中递归删除边缘性论文的数量统计示意图。

需要说明的是，这些附图和文字描述并不旨在以任何方式限制本发明的构思范围，而是通过参考特定实施例为本领域技术人员说明本发明的概念。

具体实施方式

如图1至图4所示，本发明介绍了一种基于黄金引用算法的论文推荐方法，首先，在论文数据库中选定论文群体范围；其次，依据所选定论文群体中论文的相互引用关系构建初始引用网络模型；然后，标定初始引用网络模型中论文的引用属性，并通过自引系数修订引用次数，生成自引修订论文群体；最后，递归的缩小自引修订论文群体的范围，直至结果收敛，得出黄金引用论文。

如图1所示，本实施例中，具体包括以下步骤：

S1.在论文数据库中选定论文群体范围；

S2.构建选定论文群体的初始引用网络模型；

如图3所示，构建论文引用网络，论文群体G＝(V,E)是由|V|＝N个顶点和|E|＝M条边所组成的一个有向网络，其中，G代表论文群体中论文与论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系；

引入引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；

在论文群体G中以第i篇论文为节点的被引次数通过引用变量e_i,j累加得到，则建立第i篇论文在论文群体G中的被引次数关系式为

S3.标定引用属性，建立自引修订引用网络；

首先，根据论文的作者判断论文之间的引用关系是自引还是他引；若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引；

其次，依据论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，i≥1，j≥1；在E_i中引入自引系数λ_i,j，删除初始引用网络模型中第i篇论文的自引引用关系，获得第i篇论文在论文群体中的他引引用关系；

最后，论文v_i被论文v_j引用且为自引，则引用变量e_i,j与自引系数λ_i,j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i,j的乘积为1；通过对引用变量e_i,j与自引系数λ_i,j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1；依据自引修订引用次数生成自引修订论文群体G'，从而构建出自引修订网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络

如图4所示，引入被引次数设定值k,k依次由小到大取值，采用迭代删除的方式逐层缩小论文群体的范围，直至结果收敛，其中，k为整数，且k≥0。

S4.以自引修订论文群体G'为初始论文群体，G⁰＝G'，采用迭代删除的方式逐层缩小论文群体的范围，当k大于和/或等于n时，终止删除论文节点，论文群体收敛,得出黄金引用论文，其中n为整数，且n≥0，

如图2所示，具体步骤如下：

S12.k＝1，删除论文群体G¹中自引修订引用次数等于1的论文及其引用关系，生成论文群体G^1,1，第i篇论文在论文群体G^1,1中的被引次数关系式为继续删除G^1,1中小于和/或等于1的论文及其引用关系，并生成论文群体G^1,2，继续迭代删除，直至生成论文群体G^1,q，且G^1,q中论文被其他至少2篇G^1,q中的论文引用，其中G^1,q记作G²，迭代删除的论文组成论文群体D₁，论文群体缩小为G²，含有论文数量为|V²|＝N₂篇，第i篇论文

在论文群体G²中的被引次数关系式为其中，q为整数，且q≥1；

S14.依照步骤S11-S13，继续迭代删除边缘性论文，当k＝n时，删除Gⁿ中自引修订引用次数等于n的论文及其引用关系，生成论文群体G^n,1，第i篇论文在论文群体G^n,1中的被引次数关系式为继续删除G^n,1中小于和/或等于n的论文及其引用关系，并生成论文群体G^n,2，继续迭代删除，直至生成论文群体G^n,q，且G^n,q中论文被其他至少n+1篇G^n,q中的论文引用，论文群体收敛，其中G^n,q记作Gⁿ⁺¹，迭代删除的论文组成论文群体为D_n，论文群体缩小为Gⁿ⁺¹，Gⁿ⁺¹含有论文数量为|Vⁿ⁺¹|＝N_n+1篇为黄金引用论文，其中n，q为整数，且n≥0，q≥1；

优选的，依照步骤S11-S13，k继续依次由小到大取值，N_n-1-N_n小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，Gⁿ含有论文数量为|Vⁿ|＝N_n篇为黄金引用论文，其中n为整数，且n≥0；。

优选的，依照步骤S11-S13，k继续依次由小到大取值，N_n小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，Gⁿ含有论文数量为|Vⁿ|＝N_n篇为黄金引用论文，其中n为整数，且n≥0；

优选的，依照步骤S11-S13，k继续依次由小到大取值，小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，Gⁿ含有论文数量为|Vⁿ|＝N_n篇为黄金引用论文，其中n为整数，且n≥0。

S5.输出黄金引用论文。

本实施例中，步骤S1中论文群体可以是按照主题、领域、学科和/或年代划定范围，也可以是按照设定的检索策略划定范围，也可以是数据库中的全部论文。

本实施例中，以主题为马克思的论文群体为例，首先选定论文群体主题为马克思的论文，含有论文17260篇；依据自引修订引用次数删除初始引用网络模型中的自引用关系；然后迭代的删除论文群体中的边缘性论文，即排除低质低效他引论文；最后收敛结果获得163篇黄金引用论文推荐给用户。

本实施例中，以主题为航空航天的论文群体为例，首先选定论文群体主题为航空航天的论文，含有论文20781篇；依据自引修订引用次数删除初始引用网络模型中的自引用关系；然后迭代的删除论文群体中的边缘性论文，即排除低质低效他引论文；最后收敛结果获得461篇黄金引用论文推荐给用户。

实施例一

本发明实施例中介绍了一种基于黄金引用算法的论文排序方法，包括以下步骤：首先，在论文数据库中选定论文群体范围；

其次，利用选定论文群体中论文的相互引用关系构建初始引用网络模型；

然后，标定初始引用网络模型中论文的引用属性，并引入论文的自引系数修订引用次数，生成自引修订论文群体；

最后，采用迭代筛选的方式逐层缩小自引修订论文群体的范围，将每层筛选出的论文组成论文群体，并进行降序排列。

本实施例中，论文群体可以是按照主题、领域、学科和/或年代划定范围，或者是按照设定的检索策略划定范围，或者是数据库中的全部论文；

本实施例中，所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文以及论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系。

本实施例中，引入引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；

本实施例中，标定论文引用属性，步骤如下：根据论文的作者判断论文之间的引用关系是自引还是他引；若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引；

依据论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1，其中，i≥1，j≥1；在E_i中引入自引系数λ_i,j，删除初始引用网络模型中第i篇论文的自引引用关系，获得第i篇论文在论文群体中的他引引用关系。

本实施例中，论文v_i被论文v_j引用且为自引，则引用变量e_i,j与自引系数λ_i,j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i,j的乘积为1；通过对引用变量e_i,j与自引系数λ_i,j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1。

本实施例中，依据自引修订引用次数为生成自引修订论文群体G'，从而构建出自引用网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

本实施例中，引入被引次数设定值k，k依次由小到大取值，采用迭代筛选的方式逐层缩小论文群体的范围，将每层筛选出的论文组成论文群体，并进行排序，直至输出全部的排序结果，其中，k为整数，且k≥0。

本实施例中，第k层的初始论文群体为G^k时，G^k中含有|V^k|＝N_k个节点，即含有N_k篇论文，|E^k|＝M_k条边，第i篇论文在论文群体G^k中的被引次数关系式为

采用迭代筛选的的方式缩小G^k的范围，筛选出G^k中被引次数等于k的论文及其引用关系，生成论文群体G^k,1，第i篇论文在论文群体G^k,1中的被引次数关系式为继续筛选出G^k,1中小于和/或等于k的论文及其引用关系，并生成论文群体G^k,2，继续迭代筛选，直至生成论文群体G^k,q，且G^k,q中论文被至少k+1篇G^k,q中的论文引用,形成第k+1层的初始论文群体，即G^k,q记作G^k+1；

每层迭代筛选出的论文组成论文群体D_k，筛选后的论文群体G^k+1中含有|V^k+1|＝N_k+1个节点，即含有N_k+1篇论文，|E^k+1|＝M_k+1条边，第i篇论文在论文群体G^k+1中的被引次数关系式为且被引次数大于k，其中，k、q为整数，且k≥0，q≥1。

本实施例中，以自引修订论文群体G'为初始论文群体，每层迭代删除的论文组成论文群体，并进行降序排列，直至输出全部的排序结果，具体步骤如下所示：

S11.k＝0，筛选出G⁰中自引修订引用次数等于0的论文及其引用关系，生成论文群体G^0,1，第i篇论文在论文群体G^0,1中的被引次数关系式为继续筛选出G^0,1中等于0的论文及其引用关系，并生成论文群体G^0,2，继续迭代筛选，直至生成论文群体G^0,q 且G^0,q中论文被其他至少1篇G^0,q中的论文引用，其中G^0,q记作G¹，迭代筛选出的论文组成论文群体D₀，论文群体缩小为G¹，G¹中含有|V¹|＝N₁个节点，即含有N₁篇论文，|E¹|＝M₁条边，第i篇论文在论文群体G¹中的被引次数关系式为其中，q为整数，且q≥1；

S32.k＝1，筛选出论文群体G¹中自引修订引用次数等于1的论文及其引用关系，生成论文群体G^1,1，第i篇论文在论文群体G^1,1中的被引次数关系式为继续筛选出G^1,1中小于和/或等于1的论文及其引用关系，并生成论文群体G^1,2，继续迭代筛选，直至生成论文群体G^1,q，且G^1,q中论文被其他至少2篇G^1,q中的论文引用，其中G^1,q记作G²，迭代筛选出的论文组成论文群体D₁，论文群体缩小为G²，含有论文数量为|V²|＝N₂篇，第i篇论文在论文群体G²中的被引次数关系式为其中，q为整数，且q≥1；

S33.k＝2，筛选出G²中自引修订引用次数等于2的论文及其引用关系，生成论文群体G^2,1，第i篇论文在论文群体G^2,1中的被引次数关系式为继续筛选出G^2,1中小于和/或等于2的论文及其引用关系，并生成论文群体G^2,2，继续迭代筛选，直至生成论文群体G^2,q，且G^2,q中论文被其他至少3篇G^2,q中的论文引用，其中G^2,q记作G³，迭代筛选出的论文组成论文群体为D₂，论文群体缩小为G³，含有论文数量为|V³|＝N₃篇，第i篇论文在论文群体G³中的被引次数关系式为其中，q为整数，且q≥1；

S34.依照步骤S11-S13，继续迭代筛选边缘性论文，为k＝n时，筛选出Gⁿ中自引修订引用次数等于n的论文及其引用关系,生成论文群体G^n,1，第i篇论文在论文群体G^n,1中的被引次数关系式为继续筛选出G^n,1中小于和/或等于n的论文及其引用关系，并生成论文群体G^n,2，继续迭代筛选，直至生成论文群体G^n,q，且G^n,q中论文被其他至少n+1篇G^n,q中的论文引用，其中G^n,q记作Gⁿ⁺¹，迭代筛选出的论文组成论文群体为D_n，论文群体缩小为Gⁿ⁺¹,Gⁿ⁺¹含有论文数量为|Vⁿ⁺¹|＝N_n+1篇论文，其中n，q为整数，且n≥0，q≥1；

S35.当Nⁿ⁺¹＝0时，终止筛选论文节点，输出论文群体排序结果，其中排序结果为：{D_n、D_n-1……D₂、D₁、D₀}；

本实施例中，k依次由小到大取值，k大于和/或等于某一设定值的论文群体进行迭代筛选出的论文为黄金引用论文，则从排序结果中由高到低依次输出论文群体，其中k为正整数，且k≥0；

优选的，小于和/或等于某一设定值时的论文群体进行迭代筛选出的论文为黄金引用论文，并将论文群体从排序结果中由高到低输出，n为整数，且n≥0；

优选的，N_n-1-N_n小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为黄金引用论文，并将论文群体从排序结果中由高到低输出，n为整数，且n≥0；

优选的，N_n小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为黄金引用论文，并将论文群体从排序结果中由高到低输出，n为整数，且n≥0。

本实施例中，用户手动按序查看，获取高质量的黄金引用论文。

论文的原始引用次数统计是将每次被引用记录均记为1，通过论文的作者对论文间的引用关系进一步地限定，排除论文引用关系中自引的干扰，再根据施引论文的被引情况修订论文的引用次数，排除低质低效他引论文的干扰，以自引修订论文群体G'为初始论文群体，依据自引修订引用次数，采用迭代筛选的方式逐层对论文群体筛选，筛选出的论文群体组合成论文群体，并进行降序排列，增加了用户的论文选择范围，提升用户体验。

以上所述仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明，任何熟悉本专利的技术人员在不脱离本发明技术方案范围内，当可利用上述提示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明方案的范围内。

Claims

1.一种基于黄金引用算法的论文推荐方法，其特征在于：包括以下步骤：首先，在论文数据库中选定论文群体范围；其次，依据所选定论文群体中论文的相互引用关系构建初始引用网络模型；然后，标定初始引用网络模型中论文的引用属性，并通过自引系数修订引用次数，生成自引修订论文群体；最后，迭代的缩小自引修订论文群体的范围，直至结果收敛，得出黄金引用论文；

所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文以及论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系；

所述标定论文引用属性，步骤如下：根据论文作者判定论文的引用关系是自引还是他引，若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引；

依据论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，i≥1，j≥1；

论文v_i被论文v_j引用且为自引，则引用系数e_i,j与自引系数λ_i,j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i,j的乘积为1；通过对引用变量e_i,j与自引系数λ_i,j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1；

依据自引修订引用次数为生成自引修订论文群体G'，从而构建出自引修订网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络；

引入被引次数设定值k,k依次由小到大取值，采用迭代删除的方式逐层缩小论文群体的范围，直至结果收敛，其中，k为整数，且k≥0；

第k层的初始论文群体为G^k时，G^k中含有|V^k|＝N_k个节点，即含有N_k篇论文，|E^k|＝M_k条边，第i篇论文在论文群体G^k中的被引次数关系式为

采用迭代的方式缩小G^k的范围，删除G^k中被引次数等于k的论文及其引用关系，生成论文群体G^k,1，第i篇论文在论文群体G^k,1中的被引次数关系式为继续删除G^k,1中小于和/或等于k的论文及其引用关系，并生成论文群体G^k,2，继续迭代删除，直至生成论文群体G^k,q，且G^k,q中论文被至少k+1篇G^k,q中的论文引用,形成第k+1层的初始论文群体，即G^k,q记作G^k+1；

2.根据权利要求1所述的一种基于黄金引用算法的论文推荐方法，其特征在于：

以自引修订论文群体G'为初始论文群体，G⁰＝G'，采用迭代删除的方式逐层缩小论文群体的范围，当k大于和/或等于n时，终止删除论文节点，论文群体收敛,得出黄金引用论文，其中n为整数，且n≥0，具体包括以下步骤：

S11.k＝0，删除G⁰中自引修订引用次数等于0的论文及其引用关系，生成论文群体G⁰ ^,1，第i篇论文在论文群体G^0,1中的被引次数关系式为继续删除G^0,1中等于0的论文及其引用关系，并生成论文群体G^0,2，继续迭代删除，直至生成论文群体G^0,q，且G⁰ ^,q中论文被其他至少1篇G^0,q中的论文引用，其中G^0,q记作G¹，迭代删除的论文组成论文群体D₀，论文群体缩小为G¹，G¹中含有|V¹|＝N₁个节点，即含有N₁篇论文，|E¹|＝M₁条边，第i篇论文在论文群体G¹中的被引次数关系式为其中，q为整数，且q≥1；

S12.k＝1，删除论文群体G¹中自引修订引用次数等于1的论文及其引用关系，生成论文群体G^1,1，第i篇论文在论文群体G^1,1中的被引次数关系式为继续删除G^1,1中小于或等于1的论文及其引用关系，并生成论文群体G^1,2，继续迭代删除，直至生成论文群体G^1,q，且G^1,q中论文被其他至少2篇G^1,q中的论文引用，其中G^1,q记作G²，迭代删除的论文组成论文群体D₁，论文群体缩小为G²，含有论文数量为|V²|＝N₂篇，第i篇论文在论文群体G²中的被引次数关系式为其中，q为整数，且q≥1；

S13.k＝2，删除G²中自引修订引用次数等于2的论文及其引用关系，生成论文群体G² ^,1，第i篇论文在论文群体G^2,1中的被引次数关系式为继续删除G^2,1中小于或等于2的论文及其引用关系，并生成论文群体G^2,2，继续迭代删除，直至生成论文群体G² ^,q，且G^2,q中论文被其他至少3篇G^2,q中的论文引用，其中G^2,q记作G³，迭代删除的论文组成论文群体为D₂，论文群体缩小为G³，含有论文数量为|V³|＝N₃篇，第i篇论文在论文群体G³中的被引次数关系式为其中，q为整数，且q≥1；

S14.依照步骤S11-S13，继续迭代删除边缘性论文，当k＝n时，删除Gⁿ中自引修订引用次数等于n的论文及其引用关系，生成论文群体G^n,1，第i篇论文在论文群体G^n,1中的被引次数关系式为继续删除G^n,1中小于或等于n的论文及其引用关系，并生成论文群体G^n,2，继续迭代删除，直至生成论文群体G^n,q，且G^n,q中论文被其他至少n+1篇G^n,q中的论文引用，其中G^n,q记作Gⁿ⁺¹，迭代删除的论文组成论文群体为D_n，论文群体缩小为Gⁿ⁺¹，Gⁿ ⁺¹含有论文数量为|Vⁿ⁺¹|＝N_n+1篇为黄金引用论文，其中n，q为整数，且n≥0，q≥1。

3.根据权利要求2所述的一种基于黄金引用算法的论文推荐方法，其特征在于：N_n-1-N_n小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，其中n为整数，且n≥0。

4.根据权利要求2所述的一种基于黄金引用算法的论文推荐方法，其特征在于：N_n小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，其中n为整数，且n≥0。

5.根据权利要求2所述的一种基于黄金引用算法的论文推荐方法，其特征在于：小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，其中n为整数，且n≥0。