CN108846019A

CN108846019A - 一种基于黄金引用算法的论文排序方法

Info

Publication number: CN108846019A
Application number: CN201810432864.9A
Authority: CN
Inventors: 吴晨生; 杜丽萍; 李梦辉; 刘静; 黄玉荣
Original assignee: BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Current assignee: BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Priority date: 2018-05-08
Filing date: 2018-05-08
Publication date: 2018-11-20
Anticipated expiration: 2038-05-08
Also published as: CN108846019B

Abstract

本发明公开了一种基于黄金引用算法的论文排序方法，包括以下步骤：首先，在论文数据库中选定论文群体范围；其次，依据所选定论文群体中论文的相互引用关系构建初始引用网络模型；再次，标定初始引用网络模型中论文的引用属性，并通过自引系数修订引用次数，生成自引修订论文群体；然后，以自引修订论文群体为初始论文群体，采用迭代筛选的方式逐层缩小自引修订论文群体的范围，将每层筛选出的论文组成论文群体，并进行降序排列；最后，输出排序结果。通过标定论文的引用属性，排除论文引用关系中自引的干扰，再依据自引修订引用次数，逐层提取论文群体中的论文组合成新的论文群体，并进行依次排序，依据排序结果使得用户直观的获取论文群体的分布情况，实现用户快速、准确的检索到高质量论文。

Description

一种基于黄金引用算法的论文排序方法

技术领域

本发明属于大数据论文检索推荐技术领域，具体地说涉及一种基于黄金引用算法的论文排序方法。

背景技术

学术论文的评价和学术论文的排序，作为论文检索和论文推荐系统的核心部分，一直以来都是研究人员非常关心的问题。因为，准确的学术论文评价和排序意义非常重大，例如，准确的学术论文评价和排序可以辅助量化研究人员的科研影响力，以及学术机构的科研影响力等，以及加快入门学者对于特定科学领域的学习速度。

现有技术公开了一种引文数据库中主题文献学术影响力的分析与排序方法，包括：在引文数据库中进行主题检索，获取主题文献元数据信息及主题文献间引用关系；根据获取的主题文献元数据信息及主题文献间引用关系构建主题引文网络；基于主题引文网络构建包含文献学术影响力多因素的因子图模型；使用循环最大和算法在因子图上近似推理，确定因子图中所有变量的边缘概率值；根据边缘概率值的降序排序结果，获取并输出所有主题文献的学术影响力排序。该申请只考虑了论文之间的引用关系，但因自引论文的干扰并不能完全体现论文的质量。

有鉴于此特提出本发明。

发明内容

本发明要解决的技术问题在于克服现有技术的不足，提供一种基于黄金引用算法的论文排序方法，通过黄金引用算法排除自引论文的干扰，进一步对论文群体进行筛选排序，实现用户快速、准确的检索到高质量论文。

为解决上述技术问题，本发明采用技术方案的基本构思是：一种基于黄金引用算法的论文排序方法，包括以下步骤：首先，在论文数据库中选定论文群体范围；其次，依据所选定论文群体中论文的相互引用关系构建初始引用网络模型；再次，标定初始引用网络模型中论文的引用属性，并通过自引系数修订引用次数，生成自引修订论文群体；然后，以自引修订论文群体为初始论文群体，采用迭代筛选的方式逐层缩小自引修订论文群体的范围，将每层筛选出的论文组成论文群体，并进行降序排列；最后，输出排序结果。本申请中的黄金引用算法模型，排除了引用次数中的自引，从而避免了自引在论文评价中的干扰，又以自引修订论文群体为初始群体，依据他引次数逐层迭代筛选出边缘论文，并将删除的论文组合成新的论文群体，并对这些论文群体按照降序排列，使得引用次数统计中他引情况更加直观，用户通过排序结果可准确的识别、并获取高质量论文，并且该算法简单、易于实行，用户运用本算法对论文群体中的高质量论文进行统计、计算较为方便。

进一步，所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文与论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系。

进一步，引入引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；

在论文群体G中以第i篇论文为节点的被引次数通过引用变量e_i,j累加得到，则建立第i篇论文在论文群体G中的被引次数关系式为

进一步，所述标定论文引用属性，步骤如下：根据论文作者判定论文的引用关系是自引还是他引，若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引。

进一步，依据论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1，其中，λ_i,j为自引系数，i≥1，j≥1。

进一步，论文v_i被论文v_j引用且为自引，则引用变量e_i,j与自引系数λ_i,j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i,j的乘积为1；通过对引用变量e_i,j与自引系数λ_i,j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1。

进一步，依据自引修订引用次数为生成自引修订论文群体G'，从而构建出自引修订网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

进一步，引入被引次数设定值k，k依次由小到大取值，采用迭代筛选的方式逐层缩小论文群体的范围，将每层筛选出的论文组成论文群体，并进行排序，直至输出全部的排序结果，其中，k为整数，且k≥0。

进一步，第k层的初始论文群体为G^k时，G^k中含有|V^k|＝N_k个节点，即含有N_k篇论文，|E^k|＝M_k条边，第i篇论文在论文群体G^k中的被引次数关系式为

采用迭代筛选的方式缩小G^k的范围，筛选出G^k中被引次数等于k的论文及其引用关系，生成论文群体G^k,1，第i篇论文在论文群体G^k,1中的被引次数关系式为继续筛选出G^k,1中小于和/或等于k的论文及其引用关系，并生成论文群体G^k,2，继续迭代筛选，直至生成论文群体G^k,q，且G^k,q中论文被至少k+1篇G^k,q中的论文引用,形成第k+1层的初始论文群体，即G^k,q记作G^k+1；

每层迭代筛选出的论文组成论文群体D_k，筛选后的论文群体G^k+1中含有|V^k+1|＝N_k+1个节点，即含有N_k+1篇论文，|E^k+1|＝M_k+1条边，第i篇论文在论文群体G^k+1中的被引次数关系式为且被引次数大于k，其中，k、q为整数，且k≥0，q≥1。

进一步，以自引修订论文群体G'为初始论文群体，G⁰＝G'，对每层迭代筛选出的论文群体进行降序排列，直至输出全部的排序结果，具体步骤如下所示：

S31.k＝0，筛选出G⁰中自引修订引用次数等于0的论文及其引用关系，生成论文群体G^0,1，第i篇论文在论文群体G^0,1中的被引次数关系式为继续筛选出G^0,1中等于0的论文及其引用关系，并生成论文群体G^0,2，继续迭代筛选，直至生成论文群体G^0,q，且G^0,q中论文被其他至少1篇G^0,q中的论文引用，其中G^0,q记作G¹，迭代筛选出的论文组成论文群体D₀，论文群体缩小为G¹，G¹中含有|V¹|＝N₁个节点，即含有N₁篇论文，|E¹|＝M₁条边，第i篇论文在论文群体G¹中的被引次数关系式为其中，q为整数，且q≥1；

S32.k＝1，筛选出论文群体G¹中自引修订引用次数等于1的论文及其引用关系，生成论文群体G^1,1，第i篇论文在论文群体G^1,1中的被引次数关系式为继续迭代筛选出G^1,1中论文小于和/或等于1的论文及其引用关系，并生成论文群体G^1,2，继续迭代筛选，直至生成论文群体G^1,q，且G^1,q中论文被其他至少2篇G^1,q中的论文引用，其中G^1,q记作G²，迭代筛选出的论文组成论文群体D₁，论文群体缩小为G²，含有论文数量为|V²|＝N₂篇，第i篇论文在论文群体G²中的被引次数关系式为其中，q为整数，且q≥1；

S33.k＝2，筛选出G²中自引修订引用次数等于2的论文及其引用关系，生成论文群体G^2,1，第i篇论文在论文群体G^2,1中的被引次数关系式为继续筛选出G^2,1中小于和/或等于2的论文及其引用关系，并生成论文群体G^2,2，继续迭代筛选，直至生成论文群体G^2,q，且G^2,q中论文被其他至少3篇G^2,q中的论文引用，其中G^2,q记作G³，迭代筛选出的论文组成论文群体为D₂，论文群体缩小为G³，含有论文数量为|V³|＝N₃篇，第i篇论文在论文群体G³中的被引次数关系式为其中，q为整数，且q≥1；

S34.依照步骤S11-S13，继续逐层迭代筛选出边缘论文，当k＝n时，筛选出Gⁿ中自引修订引用次数等于n的论文及其引用关系,生成论文群体G^n,1，第i篇论文在论文群体G^n,1中的被引次数关系式为继续筛选G^n,1中小于和/或等于n的论文及其引用关系，并生成论文群体G^n,2，继续迭代筛选，直至生成论文群体G^n,q，且G^n,q中论文被其他至少n+1篇G^n,q中的论文引用，其中G^n,q记作Gⁿ⁺¹，迭代筛选的论文组成论文群体为D_n，论文群体缩小为Gⁿ⁺¹,Gⁿ⁺¹含有论文数量为|Vⁿ⁺¹|＝N_n+1篇论文，其中n，q为整数，且n≥0，q≥1；

S35.当Nⁿ⁺¹＝0时，终止筛选论文节点，输出论文群体排序结果，其中排序结果为：{D_n、D_n-1……D₂、D₁、D₀}；

论文的原始引用次数统计是将每次被引用记录均记为1，通过论文作者对引用关系进一步地限定，排除论文引用关系中自引的干扰，再根据施引论文的被引情况修订论文的引用次数，得出论文群体中论文的他引次数，以自引修订论文群体G'为初始论文群体，依据自引修订引用次数，采用逐层迭代筛选的方式，逐层筛选出论文群体的边缘的论文，将筛选出的论文组成论文群体，并进行降序排列，用户通过排序结果获取所需的论文文献，实现用户快速、准确的检索到高质量论文；从而依据论文网络中他引次数的排序结果获取高质量论文的方法更加合理。

采用上述技术方案后，本发明与现有技术相比具有以下有益效果：

1、通过构建论文群体初始引用网络模型，基于论文引用次数识别高质量论文，使得论文群中论文相互之间的引用关系更加具体直观，且计算过程快速便捷，选出的论文群体具有较高的权威性。

2、实施自引修订引用次数，排除了引用次数中的自引用论文，克服了自引在论文评价中的干扰，使得评估出的论文质量更加合理；同时，逐层迭代筛选的方式，逐层筛选出论文群体的边缘论文，将筛选出的论文组成论文群体，并进行排序，使得论文群体中论文的他引关系更加直观；综合考虑作者自引和施引论文质量不均等因素，对论文的初始的引用次数进行统计修订，提高推荐系统识别高质量论文的准确性。

下面结合附图对本发明的具体实施方式作进一步详细的描述。

附图说明

附图作为本发明的一部分，用来提供对本发明的进一步的理解，本发明的示意性实施例及其说明用于解释本发明，但不构成对本发明的不当限定。显然，下面描述中的附图仅仅是一些实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。在附图中：

图1是本发明中一种基于黄金引用算法的论文排序方法流程示意图；

图2是本发明中一种基于黄金引用算法的论文推荐方法流程示意图；

图3是本发明中一种应用黄金引用论文算法的流程示意图；

图4是本发明中论文群体初始引用网络模型示意图；

图5是本发明中递归缩小自引修订论文群体的数量统计示意图。

需要说明的是，这些附图和文字描述并不旨在以任何方式限制本发明的构思范围，而是通过参考特定实施例为本领域技术人员说明本发明的概念。

具体实施方式

实施例一

如图2至图5所示，本发明介绍了一种基于黄金引用算法的论文推荐方法，首先，在论文数据库中选定论文群体范围；其次，依据所选定论文群体中论文的相互引用关系构建初始引用网络模型；然后，标定初始引用网络模型中论文的引用属性，并通过自引系数修订引用次数，生成自引修订论文群体；最后，迭代的缩小自引修订论文群体的范围，直至结果收敛，得出黄金引用论文。实施自引修订引用次数，排除了引用次数中的自引用论文，克服了自引在论文评价中的干扰，使得评估出的论文质量更加合理；同时，采用迭代删除的方式，逐层排除自引修订引用次数统计中低质低效的他引干扰；综合考虑作者自引和低质量论文引用的干扰因素，对论文的初始的引用次数进行统计修订，提高推荐系统识别高质量论文的准确性。

如图2所示，本实施例中，具体包括以下步骤：

S1.在论文数据库中选定论文群体范围；

S2.构建选定论文群体的初始引用网络模型；

如图3所示，构建论文引用网络，论文群体G＝(V,E)是由|V|＝N个顶点和|E|＝M条边所组成的一个有向网络，其中，G代表论文群体中论文与论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系；

引入引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；

在论文群体G中以第i篇论文为节点的引用次数通过引用变量e_i,j累加得到，则建立第i篇论文在论文群体G中的引用次数关系式为

S3.标定引用属性，建立自引修订引用网络；

首先，根据论文的作者判断论文之间的引用关系是自引还是他引；若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引；

其次，依据论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，i≥1，j≥1；在E_i中引入自引系数λ_i,j，删除初始引用网络模型中第i篇论文的自引引用关系，获得第i篇论文在论文群体中的他引引用关系；

最后，论文v_i被论文v_j引用且为自引，则引用变量e_i,j与自引系数λ_i,j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i,j的乘积为1；通过对引用变量e_i,j与自引系数λ_i,j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1；则第i篇论文在论文群体中的自引修订引用次数为

依据自引修订引用次数生成自引修订论文群体G'，从而构建出自引修订网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

如图4所示，引入被引次数设定值k，k依次由小到大取值，采用迭代删除的方式逐层缩小论文群体的范围，直至结果收敛，其中，k为整数，且k≥0。

S4.以自引修订论文群体G'为初始论文群体，G⁰＝G'，采用迭代删除的方式逐层缩小论文群体的范围，当k大于和/或等于n时，终止删除论文节点，论文群体收敛,得出黄金引用论文，其中n为整数，且n≥0，具体包括以下步骤：

如图2所示，具体步骤如下：

S11.k＝0，删除G⁰中自引修订引用次数等于0的论文及其引用关系，生成论文群体G^0,1，第i篇论文在论文群体G^0,1中的被引次数关系式为继续删除G^0,1中等于0的论文及其引用关系，并生成论文群体G^0,2，继续迭代删除，直至生成论文群体G⁰ ^,q，且G^0,q中论文被其他至少1篇G^0,q中的论文引用，其中G^0,q记作G¹，迭代删除的论文组成论文群体D₀，论文群体缩小为G¹，G¹中含有|V¹|＝N₁个节点，即含有N₁篇论文，|E¹|＝M₁条边，第i篇论文在论文群体G¹中的被引次数关系式为其中，q为整数，且q≥1；

S12.k＝1，删除论文群体G¹中自引修订引用次数等于1的论文及其引用关系，生成论文群体G^1,1，第i篇论文在论文群体G^1,1中的被引次数关系式为继续删除G^1,1中小于和/或等于1的论文及其引用关系，并生成论文群体G^1,2，继续迭代删除，直至生成论文群体G^1,q，且G^1,q中论文被其他至少2篇G^1,q中的论文引用，其中G^1,q记作G²，迭代删除的论文组成论文群体D₁，论文群体缩小为G²，含有论文数量为|V²|＝N₂篇，第i篇论文在论文群体G²中的被引次数关系式为其中，q为整数，且q≥1；

S13.k＝2，删除G²中自引修订引用次数等于2的论文及其引用关系，生成论文群体G^2,1，第i篇论文在论文群体G^2,1中的被引次数关系式为继续删除G^2,1中小于和/或等于2的论文及其引用关系，并生成论文群体G^2,2，继续迭代删除，直至生成论文群体G^2,q，且中论文被其他至少3篇G^2,q中的论文引用，其中G^2,q记作G³，迭代删除的论文组成论文群体为D₂，论文群体缩小为G³，含有论文数量为|V³|＝N₃篇，第i篇论文在论文群体G³中的被引次数关系式为其中，q为整数，且q≥1；

S14.依照步骤S11-S13，继续迭代删除边缘论文，当k＝n时，删除Gⁿ中自引修订引用次数等于n的论文及其引用关系,生成论文群体G^n,1，第i篇论文在论文群体G^n,1中的被引次数关系式为继续删除G^n,1中小于和/或等于n的论文及其引用关系，并生成论文群体G^n,2，继续迭代删除，直至生成论文群体G^n,q，且G^n,q中论文被其他至少n+1篇G^n,q中的论文引用，其中G^n,q记作Gⁿ⁺¹，迭代删除的论文组成论文群体为D_n，论文群体缩小为Gⁿ⁺¹，Gⁿ⁺¹含有论文数量为|Vⁿ⁺¹|＝N_n+1篇为黄金引用论文，其中n，q为整数，且n≥0，q≥1；

优选的，依照步骤S11-S13，k继续依次由小到大取值，N_n-1-N_n小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，Gⁿ含有论文数量为|Vⁿ|＝N_n篇为黄金引用论文，其中n为整数，且n≥0；。

优选的，依照步骤S11-S13，k继续依次由小到大取值，N_n小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，Gⁿ含有论文数量为|Vⁿ|＝N_n篇为黄金引用论文，其中n为整数，且n≥0；

优选的，依照步骤S11-S13，k继续依次由小到大取值，小于和/或等于某一设定值时，终止删除论文节点，论文群体收敛为Gⁿ，Gⁿ含有论文数量为|Vⁿ|＝N_n篇为黄金引用论文，其中n为整数，且n≥0。

S5.输出黄金引用论文。

本实施例中，步骤S1中论文群体可以是按照主题、领域、学科和/或年代划定范围，也可以是按照设定的检索策略划定范围，也可以是数据库中的全部论文。

本实施例中，以主题为马克思的论文群体为例，首先选定论文群体主题为马克思的论文，含有论文17260篇；依据自引修订引用次数删除初始引用网络模型中的自引用关系；然后迭代的删除论文群体中的边缘论文，即排除低质低效他引论文；最后收敛结果获得163篇黄金引用论文推荐给用户。

本实施例中，以主题为航空航天的论文群体为例，首先选定论文群体主题为航空航天的论文，含有论文20781篇；依据自引修订引用次数删除初始引用网络模型中的自引用关系；然后迭代的删除论文群体中的边缘论文，即排除低质低效他引论文；最后收敛结果获得461篇黄金引用论文推荐给用户。

实施例二

如图1所示，本发明实施例中介绍了一种基于黄金引用算法的论文排序方法，包括以下步骤：

S11.在论文数据库中选定论文群体范围；

S12.利用选定论文群体中论文的相互引用关系构建初始引用网络模型；

S13.标定初始引用网络模型中论文的引用属性，并通过论文的自引系数修订引用次数，生成自引修订论文群体；

S14.以自引修订论文群体为初始论文群体，采用迭代筛选的方式逐层缩小自引修订论文群体的范围，将每层筛选出的论文组成论文群体，并进行降序排列；

S15.输出排序结果。

本实施例中，论文群体可以是按照主题、领域、学科和/或年代划定范围，或者是按照设定的检索策略划定范围，或者是数据库中的全部论文；

本实施例中，所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文以及论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系。

本实施例中，引入引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；

本实施例中，标定论文引用属性，步骤如下：根据论文的作者判断论文之间的引用关系是自引还是他引；若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引；

依据论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，i≥1，j≥1；。在E_i中引入自引系数λ_i,j，删除初始引用网络模型中第i篇论文的自引引用关系，获得第i篇论文在论文群体中的他引引用关系。

本实施例中，论文v_i被论文v_j引用且为自引，则引用变量e_i,j与自引系数λ_i,j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i,j的乘积为1；通过对引用变量e_i,j与自引系数λ_i,j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1。

本实施例中，依据自引修订引用次数为生成自引修订论文群体G'，从而构建出自引用网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

本实施例中，引入被引次数设定值k，k依次由小到大取值，依据k值采用迭代筛选的方式逐层缩小论文群体的范围，将每层筛选出的论文组成论文群体，并进行排序，直至输出全部的排序结果，其中，k为整数，且k≥0。

本实施例中，第k层的初始论文群体为G^k时，G^k中含有|V^k|＝N_k个节点，即含有N_k篇论文，|E^k|＝M_k条边，第i篇论文在论文群体G^k中的被引次数关系式为

采用迭代筛选的方式缩小G^k的范围，筛选出G^k中被引次数等于k的论文及其引用关系，并生成论文群体G^k,1，第i篇论文在论文群体G^k,1中的被引次数关系式为继续筛选出G^k,1中小于和/或等于k的论文及其引用关系，并生成论文群体G^k,2，继续迭代筛选，直至生成论文群体G^k,q，且G^k,q中论文被至少k+1篇G^k,q中的论文引用,形成第k+1层的初始论文群体，即G^k,q记作G^k+1；

本实施例中，以自引修订论文群体G'为初始论文群体，G⁰＝G'，对每层迭代筛选出的论文群体进行降序排列，直至输出全部的排序结果，具体步骤如下所示：

S31.k＝0，筛选出G⁰中自引修订引用次数等于0的论文及其引用关系，生成论文群体G^0,1，第i篇论文在论文群体G^0,1中的被引次数关系式为继续筛选出G^0,1中等于0的论文及其引用关系，并生成论文群体G^0,2，继续迭代筛选，直至生成论文群体G^0,q，且G^0,q中论文被其他至少1篇G^0,q中的论文引用，其中G^0,q记作G¹，迭代筛选出的论文组成论文群体D₀，论文群体缩小为G¹，G¹中含有|V¹|＝N₁个节点，即含有N₁篇论文，|E¹|＝M₁条边，第i篇论文在论文群体G¹中的被引次数关系式为，其中，q为整数，且q≥1；

S32.k＝1，筛选出论文群体G¹中自引修订引用次数等于1的论文及其引用关系，生成论文群体G^1,1，第i篇论文在论文群体G^1,1中的被引次数关系式为继续迭代筛选出G^1,1中小于和/或等于1的论文及其引用关系，并生成论文群体G^1,2，继续迭代筛选，直至生成论文群体G^1,q，且G^1,q中论文被其他至少2篇G^1,q中的论文引用，其中G^1,q记作G²，迭代筛选出的论文组成论文群体D₁，论文群体缩小为G²，含有论文数量为|V²|＝N₂篇，第i篇论文在论文群体G²中的被引次数关系式为其中，q为整数，且q≥1；

S35.当N_n+1＝0时，终止筛选论文节点，输出论文群体排序结果，其中排序结果为：{D_n、D_n-1……D₂、D₁、D₀}；

本实施例中，k依次由小到大取值，k大于和/或等于某一设定值的论文群体进行迭代筛选出的论文为黄金引用论文，则从排序结果中由高到低依次输出论文群体，其中k为正整数，且k≥0；

优选的，小于和/或等于某一设定值时的论文群体进行迭代筛选出的论文为黄金引用论文，并将论文群体从排序结果中由高到低输出，n为整数，且n≥0；

优选的，N_n-1-N_n小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为黄金引用论文，并将论文群体从排序结果中由高到低输出，n为整数，且n≥0；

优选的，N_n小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为黄金引用论文，并将论文群体从排序结果中由高到低输出，n为整数，且n≥0。

本实施例中，用户手动按序查看，获取高质量的黄金引用论文。

论文的原始引用次数统计是将每次被引用记录均记为1，通过论文的作者对论文间的引用关系进一步地限定，排除论文引用关系中自引的干扰，再根据施引论文的被引情况修订论文的引用次数，得出论文群体中论文的他引次数，以自引修订论文群体G'为初始论文群体，依据自引修订引用次数，采用迭代筛选的方式逐层对论文群体筛选，筛选出的论文群体组合成新的论文群体，并进行降序排列，用户通过排序结果获取所需的高质量论文，增强了用户对高质量论文的自主选择性，提升用户体验。

以上所述仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明，任何熟悉本专利的技术人员在不脱离本发明技术方案范围内，当可利用上述提示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明方案的范围内。

Claims

1.一种基于黄金引用算法的论文排序方法，其特征在于：包括以下步骤：首先，在论文数据库中选定论文群体范围；其次，依据所选定论文群体中论文的相互引用关系构建初始引用网络模型；再次，标定初始引用网络模型中论文的引用属性，并通过自引系数修订引用次数，生成自引修订论文群体；然后，以自引修订论文群体为初始论文群体，采用迭代筛选的方式逐层缩小自引修订论文群体的范围，将每层筛选出的论文组成论文群体，进行降序排列；最后，输出排序结果。

2.根据权利要求1所述的一种基于黄金引用算法的论文排序方法，其特征在于：所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文以及论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系。

3.根据权利要求1-2任一所述的一种基于黄金引用算法的论文排序方法，其特征在于：引入引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；

4.根据权利要求1-3任一所述的一种基于黄金引用算法的论文排序方法，其特征在于：所述标定论文引用属性，步骤如下：根据论文作者判定论文的引用关系是自引还是他引，若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引。

5.根据权利要求1-4任一所述的一种基于黄金引用算法的论文排序方法，其特征在于：依据论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，λ_i,j为自引系数，i≥1，j≥1。

6.根据权利要求1-5任一所述的一种基于黄金引用算法的论文排序方法，其特征在于：论文v_i被论文v_j引用且为自引，则引用变量e_i,j与自引系数λ_i,j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i,j的乘积为1；通过对引用变量e_i,j与自引系数λ_i,j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1。

7.根据权利要求1-6任一所述的一种基于黄金引用算法的论文排序方法，其特征在于：依据自引修订引用次数为生成自引修订论文群体G'，从而构建出自引修订网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

8.根据权利要求1-7任一所述的一种基于黄金引用算法的论文排序方法，其特征在于：引入被引次数设定值k，k依次由小到大取值，采用迭代筛选的方式逐层缩小论文群体的范围，将每层筛选出的论文组成论文群体，并进行排序，直至输出全部的排序结果，其中，k为整数，且k≥0。

9.根据权利要求1-8任一所述的一种基于黄金引用算法的论文排序方法，其特征在于：第k层的初始论文群体为G^k时，G^k中含有|V^k|＝N_k个节点，即含有N_k篇论文，|E^k|＝M_k条边，第i篇论文在论文群体G^k中的被引次数关系式为

采用迭代筛选的方式逐层缩小G^k的范围，筛选出G^k中被引次数等于k的论文及其引用关系，生成论文群体G^k,1，第i篇论文在论文群体G^k,1中的被引次数关系式为继续筛选出G^k,1中小于或等于k的论文及其引用关系，并生成论文群体G^k,2，继续迭代筛选，直至生成论文群体G^k,q，且G^k,q中论文被至少k+1篇G^k,q中的论文引用,形成第k+1层的初始论文群体，即G^k,q记作G^k+1；

10.根据权利要求1-9任一所述的一种基于黄金引用算法的论文排序方法，其特征在于：以自引修订论文群体G'为初始论文群体，G⁰＝G'，对每层迭代筛选出的论文群体进行降序排列，直至输出全部的排序结果，具体步骤如下所示：

S31.k＝0，筛选出G⁰中自引修订引用次数等于0的论文及其引用关系，生成论文群体G^0,1，第i篇论文在论文群体G^0,1中的被引次数关系式为继续筛选出G^0,1中E_i ^0,1等于0的论文及其引用关系，并生成论文群体G^0,2，继续迭代筛选，直至生成论文群体G⁰ ^,q，且G^0,q中论文被其他至少1篇G^0,q中的论文引用，其中G^0,q记作G¹，迭代筛选出的论文组成论文群体D₀，论文群体缩小为G¹，G¹中含有|V¹|＝N₁个节点，即含有N₁篇论文，|E¹|＝M₁条边，第i篇论文在论文群体G¹中的被引次数关系式为其中，q为整数，且q≥1；

S35.当Nⁿ⁺¹＝0时，终止筛选论文节点，输出论文群体排序结果，其中排序结果为：{D_n、D_n-1……D₂、D₁、D₀}。