CN109002524A

CN109002524A - 一种基于论文引用关系的黄金引用作者排序方法

Info

Publication number: CN109002524A
Application number: CN201810769031.1A
Authority: CN
Inventors: 吴晨生; 刘彦君; 刘如; 刘静
Original assignee: BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Current assignee: BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Priority date: 2018-07-13
Filing date: 2018-07-13
Publication date: 2018-12-14
Anticipated expiration: 2038-07-13
Also published as: CN109002524B

Abstract

本发明公开了一种基于论文引用关系的黄金引用作者排序方法，包括如下步骤：首先，在论文数据库中选定论文群体范围，获取引用关系以及作者信息；其次，依据论文群体中论文的相互引用关系及作者信息构建初始论文引用网络模型；再次，标定初始论文引用属性，建立自引修订引用系数，生成排除自引的论文他引网络；然后，将论文他引网络通过线性映射生成作者引用网络；最后，采用递归删除的方式缩小作者引用网络的范围，直至结果收敛，输出得到黄金引用作者，计算作者重要度参数并排序。本发明提供的论文作者排序方法易于实施，且可有效排除论文自引和低质低效的他引干扰，以帮助研究者快速地准确地为作者重要程度排序。

Description

一种基于论文引用关系的黄金引用作者排序方法

技术领域

本发明涉及论文检索技术领域，具体地说，涉及一种基于论文引用关系的黄金引用作者排序方法。

背景技术

科学计量学认为，论文之间的引用和被引用关系能够反应学术传播规律，被引用多次的论文或者作者在学术传播过程中具有相当大的贡献，因此对引文网络中论文或作者被引次数的分析有利于科研工作者或文献研究工作者找到某一领域或学科的核心论文和核心作者。

现有技术中，基于作者在合作网络的节点指标的核心作者排序方法受采集技术限制，检索不全面或信息源不准确会导致合作网络无法反映真实情况。基于论文引用次数提出了h指数、g指数，用于评估研究人员的学术产出数量与学术产出水平，没有综合考虑作者自引和施引作者水平差异，而不能完全体现作者的重要性。

有鉴于此，特提出本发明。

发明内容

本发明旨在提供一种基于论文引用关系的黄金引用作者排序方法，较为快捷并且准确地实现了论文作者的发现过程，以便使用者甄选出影响力较大的作者。

为实现上述目的，本发明具体采用如下技术方案：

本发明提供了一种基于论文引用关系的黄金引用作者排序方法，包括如下步骤：

首先，在论文数据库中选定论文群体范围，获取引用关系以及作者信息；

其次，依据论文群体中论文的相互引用关系及作者信息构建初始论文引用网络模型；

再次，标定初始论文引用属性，建立自引修订引用系数，生成排除自引的论文他引网络；

然后，将论文他引网络通过线性映射生成作者引用网络；

最后，采用递归删除的方式缩小作者引用网络的范围，直至结果收敛，输出得到黄金引用作者，计算作者重要度参数并排序。

上述方法中，在论文网络映射生成作者引用网络前，先排除论文引用次数中的自引，克服了自引在作者评价中的干扰。之后，采用层层剥离的方式排除作者引用次数统计中低质低效的他引干扰，依据论文间的引用次数，综合考虑论文自引干扰和分等级作者引用等因素，对论文引用次数进行统计修订，提高了黄金引用作者识别的准确性。在此基础上，为了更好地研究作者的重要性，引入作者重要度参数，根据黄金引用作者被引用的迭代层数及黄金引用作者在作者引用网络中的核心位置，计算作者重要度参数并排序。其中，作者群体可以是按照主题、领域、学科和/或年代划定范围，也可以是按照设定的检索策略划定范围，也可以是数据库中的全部论文。

根据上述方法，所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文以及论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系。

根据上述方法，为构建论文引用网络模型，引入论文引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；在论文群体G中以第i篇论文为节点的被引次数通过引用变量e_i,j累加得到，则建立第i篇论文在论文群体G中的被引次数关系式为

上述方法中，构建论文引用网络，论文为顶点，论文引用关系为边；论文群体G＝(V,E)是由|V|＝N个节点和|E|＝M条边所组成的一个有向网络：

其中，

i≥1，j≥1，如果顶点v_i指向v_j的有向边存在，即论文v_i被论文v_j引用，则边元素为1；若顶点v_i指向v_j的有向边不存在，即论文v_i未被论文v_j引用，则边元素为0。

根据上述方法，所述生成排除自引的论文他引网络包括如下步骤：

标定论文引用属性，若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引。

根据上述方法，为标定论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，i≥1，j≥1。

上述方法中，标定论文引用属性，即判定该次引用是自引还是他引；若一篇论文与该论文引用的作者没有相同作者，则该次引用称为他引，若两篇论文有共同的作者，即至少有一个作者相同，则该次引用称为自引。

根据上述方法，论文v_i被论文v_j引用且为自引，则引用系数e_i,j与自引系数λ_i._j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i.j的乘积为1；通过对引用变量e_i,j与自引系数λ_i.j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1。

根据上述方法，依据自引修订引用次数为生成排除自引的论文他引网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

根据上述方法，将论文他引网络通过线性映射生成作者引用网络，作者为顶点，作者引用关系为边；作者群体G^auth.＝(V^auth.,E^auth.)是由|V^auth.|＝N^auth.个节点和|E^auth.|＝M^auth.条边所组成的一个有向网络；其中，G^auth.代表作者群体中作者以及作者间引用关系的集合，V^auth.代表作者群体G^auth.中的作者集合，E^auth.代表作者群体G^auth.中作者间的引用关系；

引入作者引用变量代表作者群体G^auth.中作者与作者的引用关系，若作者发表的某一篇论文被作者发表的某一篇论文引用，记为1，是作者指向作者有向边数量之和，即作者发表论文被作者引用次数总和，记为m；若作者发表的论文未被作者发表的论文引用，则记为0；

在作者群体G^auth.中作者i的被引次数通过引用变量累加得到，则建立作者i在作者群体G^auth.中的被引次数关系式为作者可以多次被作者引用，作者也可以引用作者

提取出作者引用网络的局部特征，表示作者节点的出链指向的节点集合，即作者的施引作者集合。

上述方法中，作者群体G^auth.＝(V^auth.,E^auth.)是由|V^auth.|＝N^auth.个节点和|E^auth.|＝M^auth.条边所组成的一个有向网络：其中，并且，i≥1，j≥1。

根据上述方法，递归删除引用网络中的边缘性节点以缩小作者引用网络的范围，同时引入作者节点的被引次数设定值k，k依次由小到大取值，直至结果收敛，输出得到黄金引用作者，其中，k为整数，且k≥0；

当第k层筛选的初始作者群体为G^auth.,k时，G^auth.,k中含有个节点，即含有个作者，条引用关系，作者i在作者群体G^auth.,k中的被引次数关系式为施引作者集合为

采用递归的方式缩小G^auth.,k的范围，删除G^auth.,k中被引次数等于k的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于k的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且形成第k+1层的初始作者群体，即记作G^auth.,k+1；

每层递归删除的作者组成第k层作者群体删除后的作者群体G^auth.,k+1中含有个节点，即含有个作者，条边，作者i在作者群体G^auth. ^,k+1中的被引次数关系式为且作者i在作者群体G^auth.,k+1中的施引作者集合为其中，k、q为整数，且k≥0，q≥1；

作者群体G^auth.,k+1中含有的个作者即为黄金引用作者，之后对黄金引用作者计算作者重要度参数并排序，其中，k为整数，且k≥0。

上述方法中，首先去除作者引用网络G^auth.中引用次数小于k的所有作者及其引用关系；如果在剩下的节点中仍有引用次数小于k的节点，那么就继续删除这些节点，直至群体中剩下的作者被引用次数不小于k，依次取k＝0,1,2,3,.....；k取的最大值是递归删除边缘性节点的终止条件。在上述各次删除节点的过程中，计算得出作者重要度参数根据该参数对黄金引用作者进行计算排序。

根据上述方法，删除引用网络中的边缘性节点时，以作者群体G^auth.为初始作者群体，G^auth.,0＝G^auth.，采用递归删除的方式逐层缩小作者群体的范围，当k大于或等于n时，终止删除作者节点，作者群体收敛，根据作者重要度参数得到黄金引用作者的排序，其中n为整数，且n≥0，具体包括以下步骤：

S1.k＝0，删除G^auth.,0中被引次数等于0的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中等于0的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth. ^,1，k＝0层删除的作者组成作者群体作者群体缩小为G^auth.,1，G^auth.,1中含有个节点，即含有个作者，条边，作者i在作者群体G^auth.,1中的被引次数关系式为作者i在作者群体G^auth.,1中的施引作者集合为其中，q为整数，且q≥1；

S2.k＝1，删除G^auth.,1中被引次数等于1的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于1的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth.,2，k＝1层删除的作者组成作者群体作者群体缩小为G^auth.,2，G^auth.,2中含有个节点，即含有个作者，条边，作者i在作者群体G^auth.,2中的被引次数关系式为作者i在作者群体G^auth.,2中的施引作者集合为其中，q为整数，且q≥1；

S3.k＝2，删除G^auth.,2中被引次数等于2的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于2的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth.,3，k＝2层删除的作者组成作者群体作者群体缩小为G^auth.,3，G^auth.,3中含有个节点，即含有个作者，条边，作者i在作者群体G^auth.,3中的被引次数关系式为作者i在作者群体G^auth.,3中的施引作者集合为其中，q为整数，且q≥1；

S4.依照步骤S1-S3，继续递归删除边缘性作者，当k＝n时，删除G^auth.,n中被引次数等于n的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于n的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth.,n+1，k＝n层删除的作者组成作者群体为作者群体缩小为G^auth.,n+1，作者i在作者群体G^auth.,n+1中的施引作者集合为G^auth.,n+1含有作者数量为个，即为黄金引用作者，之后对黄金引用作者计算作者重要度参数并排序，其中，k为整数，且k≥0其中n、q为整数，且n≥0，q≥1；

优选的，不大于某一设定值时，终止删除作者节点，作者群体收敛为G^auth.,n，其中n为整数，且n≥0；

优选的，不大于某一设定值时，终止删除作者节点，作者群体收敛为G^auth.,n，其中n为整数，且n≥0。

根据上述方法，递归地删除作者后，群体被缩小成该作者群体视为不可压缩的作者群体，所含作者即黄金引用作者。

为便于理解，如下表1中列出了各步骤统一使用的主要数学符号及其含义：

表1：主要数学符号及其含义一览表

本发明的有益效果为：

1.本发明提供的算法模型，在由论文网络映射生成作者引用网络前，先排除论文引用次数中的自引，克服了自引在作者评价中的干扰，再在采用层层剥离的方式排除作者引用次数统计中低质低效的他引干扰；这种依据论文间的引用次数，综合考虑论文自引干扰和分等级作者引用等因素，对论文引用次数进行统计修订，提高了黄金引用作者识别的准确性；

2.本发明提供的算法模型根据论文作者情况不统计作者自引，再根据施引论文的他引情况映射生成作者引用次数，然后通过修订作者的引用次数，递归地缩小作者群体。这种修订论文引用次数的方式和分等级处理作者引用关系，使得采用论文引用次数来评估论文作者能力的方法更加合理；

3.本发明提供的算法模型数据来源于论文数据库，信息源稳定准确，数据真实可靠；

4.本发明提供的算法模型时间复杂度低，根据初始论文群体的选定范围进行统计且计算，使得普通科研工作者或文献研究工作者也能完成黄金引用作者的统计计算工作；

5.本发明提供的算法模型综合考虑了作者节点本身及其施引作者节点在群体中具有的位置特点，作为黄金引用作者排序的依据，使得排序方法更准确。

附图说明

图1为本发明的黄金引用作者排序方法的流程示意图。

图2为本发明中包括详细步骤的黄金引用作者发现方法的流程示意图。

图3为本发明将论文他引网络通过线性映射生成作者引用网络的示意图。

图4为本发明中递归删除作者引用网络中的边缘性节点至结果收敛的示意图。

具体实施方式

为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚，下面将结合附图对本发明的实施方式作进一步的详细描述。

实施例1

本实施例中，如图1和图2所示，提供了一种基于论文引用关系的黄金引用作者排序方法，包括如下步骤：

S1.在论文数据库中选定论文群体范围，获取引用关系以及作者信息；

S2.依据论文群体中论文的相互引用关系及作者信息构建初始论文引用网络模型；

本实施例中，步骤S2所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文以及论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系。

本实施例中，为构建步骤S2中的论文引用网络模型，引入论文引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；在论文群体G中以第i篇论文为节点的被引次数通过引用变量e_i,j累加得到，则建立第i篇论文在论文群体G中的被引次数关系式为

本实施例中，构建论文引用网络，论文为顶点，论文引用关系为边；论文群体G＝(V,E)是由|V|＝N个节点和|E|＝M条边所组成的一个有向网络：

其中，

S3.标定初始论文引用属性，建立自引修订引用系数，生成排除自引的论文他引网络；

本实施例中，步骤S3中所述生成排除自引的论文他引网络包括如下步骤：

首先，标定论文引用属性，即判定该次引用是自引还是他引；若一篇论文与该论文引用的作者没有相同作者，则该次引用称为他引，若两篇论文有共同的作者，即至少有一个作者相同，则该次引用称为自引。即为，若论文v_i被论文v_j引用，当论文v_i与论文v_j中没有相同作者，则该次引用为他引；当论文v_i与论文v_j中至少有一个相同作者，则该次引用为自引。

然后，为标定论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，i≥1，j≥1。本实施例中，论文v_i被论文v_j引用且为自引，则引用系数e_i,j与自引系数λ_i.j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i.j的乘积为1；通过对引用变量e_i,j与自引系数λ_i.j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1。

最后，依据自引修订引用次数为生成排除自引的论文他引网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

S4.将论文他引网络通过线性映射生成作者引用网络；

本实施例中，如图3所示，首先将论文他引网络通过线性映射生成作者引用网络，作者为顶点，作者引用关系为边；作者群体G^auth.＝(V^auth.,E^auth.)是由|V^auth.|＝N^auth.个节点和|E^auth.|＝M^auth.条边所组成的一个有向网络；其中，G^auth.代表作者群体中作者以及作者间引用关系的集合，V^auth.代表作者群体G^auth.中的作者集合，E^auth.代表作者群体G^auth.中作者间的引用关系；

然后，引入作者引用变量代表作者群体G^auth.中作者与论作者的引用关系，若作者发表的某一篇论文被作者发表的某一篇论文引用，记为1，是作者指向作者有向边数量之和，即作者发表论文被作者引用次数总和，记为m；若作者发表的论文未被作者发表的论文引用，则记为0；

最后，在作者群体G^auth.中作者i的被引次数通过引用变量累加得到，则建立作者i在作者群体G^auth.中的被引次数关系式为作者可以多次被作者引用，作者也可以引用作者

本实施例中，作者群体G^auth.＝(V^auth.,E^auth.)是由|V^auth.|＝N^auth.个节点和|E^auth.|＝M^auth.条边所组成的一个有向网络：

其中，并且，i≥1，j≥1。

S5.采用递归删除的方式缩小作者引用网络的范围，直至结果收敛，输出得到黄金引用作者，计算作者重要度参数并排序。

本实施例中，首先通过删除引用网络中的边缘性节点缩小作者引用网络的范围，同时引入作者节点的被引次数设定值k，k依次由小到大取值，直至结果收敛，输出得到黄金引用作者，其中，k为整数，且k≥0；当第k层筛选的初始作者群体为G^auth.,k时，G^auth.,k中含有个节点，即含有个作者，条引用关系，作者i在作者群体G^auth.,k中的被引次数关系式为施引作者集合为

然后，采用递归的方式缩小G^auth.,k的范围，删除G^auth.,k中被引次数等于k的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于k的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且形成第k+1层的初始作者群体，即记作G^auth.,k+1；每层递归删除的作者组成第k层作者群体删除后的作者群体G^auth.,k+1中含有个节点，即含有个作者，条边，作者i在作者群体G^auth.,k+1中的被引次数关系式为且作者i在作者群体G^auth.,k+1中的施引作者集合为其中，k、q为整数，且k≥0，q≥1；

本实施例中，首先去除作者引用网络G^auth.中引用次数小于k的所有作者及其引用关系；如果在剩下的节点中仍有引用次数小于k的节点，那么就继续删除这些节点，直至群体中剩下的作者被引用次数不小于k，依次取k＝0,1,2,3,.....；k取的最大值是递归删除边缘性节点的终止条件。

本实施例中，如图4所示，进一步说明通过删除边缘性节点缩小作者引用网络范围的流程，删除引用网络中的边缘性节点时，以作者群体G^auth.为初始作者群体，G^auth.,0＝G^auth.，当k大于或等于n时，终止删除作者节点，作者群体收敛，根据作者重要度参数得到黄金引用作者的排序，其中n为整数，且n≥0，具体包括以下步骤：

S51.图4中的圆点为论文作者节点，在k＝0层，删除G^auth.,0中被引次数等于0的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中等于0的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth.,1，k＝0层删除的作者组成作者群体作者群体缩小为G^auth.,1，G^auth.,1中含有个节点，即含有个作者，条边，作者i在作者群体G^auth.,1中的被引次数关系式为作者i在作者群体G^auth.,1中的施引作者集合为其中，q为整数，且q≥1；

S52.图4中的圆点为论文作者节点，在k＝1层，删除G^auth.,1中被引次数等于1的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于1的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth.,2，k＝1层删除的作者组成作者群体作者群体缩小为G^auth.,2，G^auth.,2中含有个节点，即含有个作者，条边，作者i在作者群体G^auth.,2中的被引次数关系式为作者i在作者群体G^auth.,2中的施引作者集合为其中，q为整数，且q≥1；

S53.图4中的圆点为论文作者节点，在k＝2层，删除G^auth.,2中被引次数等于2的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于2的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth.,3，k＝2层删除的作者组成作者群体作者群体缩小为G^auth.,3，G^auth.,3中含有个节点，即含有个作者，条边，作者i在作者群体G^auth.,3中的被引次数关系式为作者i在作者群体G^auth.,3中的施引作者集合为其中，q为整数，且q≥1；

S54.依照步骤S51-S53(图4中未显示)，继续递归删除边缘性作者，当k＝n时，删除G^auth.,n中自引修订引用次数等于n的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于n的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth.,n+1，k＝n层删除的作者组成作者群体为作者群体缩小为G^auth.,n+1，作者i在作者群体G^auth.,n+1中的施引作者集合为G^auth.,n+1含有作者数量为个，即为黄金引用作者，之后对黄金引用作者计算作者重要度参数并排序，其中，k为整数，且k≥0，其中n、q为整数，且n≥0，q≥1；

本实施例中，构建主题为马克思的作者引用网络，首先选定论文群体主题为马克思的论文，含有论文17260篇以及14981名作者；根据作者引用属性，依据自引修订引用次数删除初始引用网络模型中的自引用关系，生成排除自引的论文他引网络模型G'＝(V',E')，之后将论文他引网络通过线性映射生成作者引用网络G^auth.＝(V^auth.,E^auth.)；然后递归地删除作者群体中的边缘性节点，最后收敛结果获得114个马克思领域黄金引用作者，计算黄金作者的作者重要度参数X_i，并输出黄金作者排序结果。

本实施例中，构建主题为航空航天的作者引用网络，首先选定论文群体主题为航空航天的论文，含有论文20781篇以及48619名作者；依据自引修订引用次数删除初始引用网络模型中的自引用关系，生成排除自引的论文他引网络模型G'＝(V',E')，之后将论文他引网络通过线性映射生成作者引用网络G^auth.＝(V^auth.,E^auth.)；然后递归地删除作者群体中的边缘性节点，最后收敛结果获得1,052个航空航天领域黄金引用作者，计算黄金作者的作者重要度参数X_i，并输出黄金作者排序结果。

本实施例中，在论文网络映射生成作者引用网络前，先排除论文引用次数中的自引，克服了自引在作者评价中的干扰，再采用层层剥离的方式排除作者引用次数统计中低质低效的他引干扰，依据论文间的引用次数，综合考虑论文自引干扰和分等级作者引用等因素，对论文引用次数进行统计修订，提高了黄金引用作者识别的准确性。综合考虑黄金引用作者自身及其施引作者在群体中所处的位置，作为黄金引用作者排序的依据，使得排序方法更准确。其中，论文群体可以是按照主题、领域、学科和/或年代划定范围，也可以是按照设定的检索策略划定范围，也可以是数据库中的全部论文。

上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。

Claims

1.一种基于论文引用关系的黄金引用作者排序方法，其特征在于，包括如下步骤：

然后，将论文他引网络通过线性映射生成作者引用网络；

2.根据权利要求1所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，所述初始引用网络模型为：G＝(V,E)，G＝(V,E)是由|V|＝N个论文节点和|E|＝M条边所组成的一个有向网络；其中，G代表论文群体中论文以及论文间引用关系的集合，V代表论文群体G中的论文集合，E代表论文群体G中论文间的引用关系。

3.根据权利要求2所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，为构建论文引用网络模型，引入论文引用变量e_i,j，e_i,j代表论文群体G中论文v_i与论文v_j的引用关系，若论文v_i被论文v_j引用，则e_i,j等于1；若论文v_i未被论文v_j引用，则e_i,j等于0，其中i≥1，j≥1；在论文群体G中以第i篇论文为节点的被引次数通过引用变量e_i,j累加得到，则建立第i篇论文在论文群体G中的被引次数关系式为

4.根据权利要求1～3任意一项所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，所述生成排除自引的论文他引网络包括如下步骤：

5.根据权利要求4所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，为标定论文引用属性，引入自引系数λ_i,j，若论文v_i与被引论文v_j为自引关系，则λ_i,j等于0；若论文v_i与被引论文v_j为他引关系，则λ_i,j等于1；其中，i≥1，j≥1。

6.根据权利要求3或5所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，论文v_i被论文v_j引用且为自引，则引用系数e_i,j与自引系数λ_i.j的乘积为0；论文v_i被论文v_j引用且为他引，则引用变量e_i,j与自引系数λ_i.j的乘积为1；通过对引用变量e_i,j与自引系数λ_i.j的乘积相累加，排除了第i篇论文在初始引用网络模型中的自引用关系，则建立第i篇论文在论文群体中的自引修订引用次数公式为其中，i≥1，j≥1。

7.根据权利要求6所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，依据自引修订引用次数为生成排除自引的论文他引网络模型G'＝(V',E')；G'＝(V',E')是由|V'|＝N个节点和|E'|＝M'条边所组成的一个有向网络。

8.根据权利要求1～7任意一项所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，将论文他引网络通过线性映射生成作者引用网络，作者为顶点，作者引用关系为边；作者群体G^auth.＝(V^auth.,E^auth.)是由|V^auth.|＝N^auth.个节点和|E^auth.|＝M^auth.条边所组成的一个有向网络；其中，G^auth.代表作者群体中作者以及作者间引用关系的集合，V^auth.代表作者群体G^auth.中的作者集合，E^auth.代表作者群体G^auth.中作者间的引用关系；

9.根据权利要求1～8任意一项所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，递归删除引用网络中的边缘性节点以缩小作者引用网络的范围，同时引入作者节点的被引次数设定值k，k依次由小到大取值，直至结果收敛，输出得到黄金引用作者，其中，k为整数，且k≥0；

作者群体G^auth.,k+1中含有个作者，即为黄金引用作者，计算作者重要度参数并排序，其中，k为整数，且k≥0。

10.根据权利要求1～9任意一项所述的基于论文引用关系的黄金引用作者排序方法，其特征在于，删除引用网络中的边缘性节点时，以作者群体G^auth.为初始作者群体，G^auth.,0＝G^auth.，采用递归删除的方式逐层缩小作者群体的范围，当k大于和/或等于n时，终止删除作者节点，作者群体收敛，根据作者重要度参数得到黄金引用作者的排序，其中n为整数，且n≥0，具体包括以下步骤：

S4.依照步骤S1-S3，继续递归删除边缘性作者，当k＝n时，删除G^auth.,n中被引次数等于n的作者及其引用关系，生成作者群体作者i在作者群体中的被引次数关系式为继续删除中不大于n的作者及其引用关系，并生成作者群体作者i在作者群体中的被引次数关系式为继续递归删除，直至生成作者群体作者i在作者群体中的被引次数关系式为且其中记作G^auth.,n+1，k＝n层删除的作者组成作者群体为作者群体缩小为G^auth.,n+1，作者i在作者群体G^auth.,n+1中的施引作者集合为G^auth.,n+1含有作者数量为个，即为黄金引用作者，之后对黄金引用作者计算作者重要度参数并排序，其中，k为整数，且k≥0，其中n、q为整数，且n≥0，q≥1；

优选的，不大于某一设定值时，终止删除作者节点，作者群体收敛为G^auth. ^,n，其中n为整数，且n≥0；