CN110163487A

CN110163487A - 非学科依赖的论文引用影响力标准化方法

Info

Publication number: CN110163487A
Application number: CN201910344881.1A
Authority: CN
Inventors: 吕国良
Original assignee: Zhejiang Sci Tech University ZSTU
Current assignee: Zhejiang Sci Tech University ZSTU
Priority date: 2019-04-26
Filing date: 2019-04-26
Publication date: 2019-08-23

Abstract

本发明公开了一种非学科依赖的论文引用影响力标准化方法，该方法包括：(1)计算期刊m中论文i的引用期望值(2)构建期刊m的期刊引用网络，计算期刊m引用影响力的修正因子β；(3)计算引用标准化因子(4)计算论文i的引用影响力本申请通过构建期刊引用网络，形成了具有相同引用行为的学术共同体；在该学术共同体的基础上计算论文引用影响力的修正因子β，并利用对进行修正，则论文的引用影响力取决于：论文自身的被引频次，该论文在期刊中引用影响力的相对大小、该期刊在其学术共同体中的引用影响力的相对大小；确保对论文的引用影响力作出合理公正的评估。

Description

非学科依赖的论文引用影响力标准化方法

技术领域

本发明属于学术评价方法领域，具体涉及一种非学科依赖的论文引用影响力标准化方法。

背景技术

学术评价是学术活动中的不可或缺的重要内容，是提高学术研究质量的重要一环。对学术成果的引用影响力进行量化分析，是对同行评议主导的学术成果质量评价的重要补充，已变得越来越不可或缺(BORNMANN,L.2011.Scientific Peer Review.AnnualReview of Information Science and Technology,45,199-245.；MOED,H.F.&HALEVI,G.2015.Multidimensional assessment of scholarly research impact.Journal ofthe Association for Information Science and Technology,66,1988-2002.)。论文是科研活动的基础性成果，由于论文被引用意味着该论文在某种程度上对引用它的文献施加了学术影响，Radicchi等人则用实证研究证明了论文的被引频次能够比较准确地表达其引用影响力(RADICCHI,F.,WEISSMAN,A.&BOLLEN,J.2017.Quantifying perceived impactof scientific publications.Journal of Informetrics,11,704-712)。因此，可以认为被引频次是论文的引用影响力的表征，是引用影响力的量化表达。被引频次越多，意味着该论文的引用影响力越大。

以被引频次表示引用影响力的优势在于论文的被引频次直接反映在学术成果的出版环节中：论文是学术成果文献化的重要表现形式，为保证出版，论文必须依据科学与研究的基本法则，充分表达其对学术研究的背景——研究现状和发展态势的认识。这种认识蕴含在论文内的一系列标记中，这些标记通常体现为参考文献的引用位置的标注与参考文献的列表(RADICCHI,F.,WEISSMAN,A.&BOLLEN,J.2017.Quantifying perceived impactof scientific publications.Journal of Informetrics,11,704-712.)。

然而，大量的文献研究表明，不同研究领域客观上造成了不同的引用行为，单纯用被引频次来计量、评价和比较不同研究领域的论文的引用影响力的大小，是无意义的，显然是不合适的(MOED,H.F.2010.Measuring contextual citationimpact of scientificjournals.Journal of Informetrics,4,265-277.)。目前，基于被引频次的论文的引用影响力的评价体系通常依赖于学科的划分，即，同个学科的论文被视作具有相同的引用行为，因此它们以学科分类来确定论文的引用行为，论文根据其所在学科赋予引用标准化因子，利用该引用标准化因子来消除学科间存在的引用行为的差异，达到比较不同学科的论文的引用影响力大小的目的(WALTMAN,L.&VAN ECK,N.J.2015.Field-normalized citationimpact indicators and the choice of an appropriate counting method.Journal ofInformetrics,9,872-894.；MOED,H.F.2010.Measuring contextual citation impact ofscientific journals.Journal of Informetrics,4,265-277.)。如，极具声望的评价体系ESI(Essential Science Indicators)以学科内论文篇均被引频次作为论文的引用标准化因子。

ESI评价体系是以其内置的22个学科类别为基础，以相同学科内论文的篇均被引频次ρ作为该学科的引用标准化因子(normalization factor)，论文被引频次与其学科的引用标准化因子之比MNCS(BORNMANN,L.&HAUNSCHILD,R.2016.Citation scorenormalized by cited references(CSNCR):The introduction of a new citationimpact indicator.Journal of Informetrics,10 875-887.)作为衡量论文的引用影响力大小的依据，参见公式(1)和(2)。

公式(1)和(2)中，N表示某一学科内的论文数量，C_i表示该学科中论文i的被引频次。

以相同学科内论文的篇均被引频次ρ作为引用标准化因子的评价方法，能够在很大程度上纠正不同学科由于引用行为不同所导致的被引频次的差异，是目前较为公认的评价指标(HICKS,D.,WOUTERS,P.,WALTMAN,L.,DE RIJCKE,S.&RAFOLS,I.2015.The LeidenManifesto for research metrics.Nature,520,429-431.)。然而，基于学科分类基础之上的引用影响力的评价指标的缺陷是：(1)该评价指标依赖于学科分类，然而：①已成型的学科分类体系更新速度慢，难以跟上科学研究的快速发展的需要；②各学科间存在着“你中有我，我中有你”的交叉与渗透的关系，这就导致学科之间也存在着文献交互引用的现象，而将学科分类作为引用行为划分的标准，则会使评价结果受学科边界划分方式的影响(Zitt,2010)，而且应用以某个学科为依据获得的引用标准化因子来评价原本处于学科交叉范围内的学术成果，评价结果难以令人信服；③在某些学科分类体系(如ESI分类体系)中，学科的粒度太粗，太过宽泛，即便在同一学科内，研究领域不同，其引用行为也存在很大的差异(NEUHAUS,C.&DANIEL,H.D.2009.A new reference standard for citation analysis inchemistry and related fields based on the sections of ChemicalAbstracts.Scientometrics,78,219-229.；VAN ECK,N.J.,WALTMAN,L.,VAN RAAN,A.F.J.,KLAUTZ,R.J.M.&PEUL,W.C.2013.Citation Analysis May Severely Underestimate theImpact of Clinical Research as Compared to Basic Research.Plos One,8,6.；VANLEEUWEN,T.N.&MEDINA,C.C.2012.Redefining the field of economics:Improvingfield normalization for the application of bibliometric techniques in thefield of economics.Research Evaluation,21,61-70.)；这就极有可能导致理应作为不同引用行为区别对待的不同研究领域的论文，却因被划分在相同学科中而被赋予了相同的引用标准化因子，如此将会使某些领域的论文的引用影响力值虚高，而使其他一些领域的论文的引用影响力被低估；(2)论文的被引频次即为该论文出版后被其他文献引用的次数，因此标准化因子值ρ随时间变化而波动。引用标准化因子作为评价体系中的基准值，其值本身的不确定性——随时间而波动，影响了评价结果的可信度。

作为MNCS的变体形式，MNCS_j是基于期刊水平的引用标准化的评价体系，即以期刊为单元，论文的篇均被引频次作为标准化因子，计算方法相对于MNCS虽然要简单方便，但是不难看出，MNCS_j不仅存在与MNCS相同的缺陷——其标准化因子随时间而波动，而且MNCS_j十分有利于影响因子低的期刊中的论文(Zitt,2010)，因为期刊的影响因子越低，MNCS_j的分母就越小。如，某相同研究领域的两篇论文，有期刊X(假设影响因子IF＝10，评价年度篇均被引频次10)中论文a(被引频次10)，期刊Y(假设影响因子IF＝2，评价年度篇均被引频次2)中论文b(被引频次5)，不言自明，无论从出版论文的期刊的影响因子还是论文的被引频次，a的引用影响力都要b要强，但是MNCS_X(a)＝10/10＝1，而MNCS_Y(b)＝5/2＝2.5，从该评价指标的引用影响力来看，X却比Y要弱很多。因此MNCS_j评价体系显然是不符合学术评价的目的和宗旨的。

Bornmann等人提出的基于论文的参考文献的评价方法(BORNMANN,L.&HAUNSCHILD,R.2016.Citation score normalized by cited references(CSNCR):Theintroduction of a new citation impact indicator.Journal of Informetrics,10875-887.；MARX,W.&BORNMANN,L.2015.On the causes of subject-specific citationrates in Web of Science.Scientometrics,102,1823-1827.；WALTMAN,L.&VAN ECK,N.J.2013.Source normalized indicators of citation impact:an overview ofdifferent approaches and an empirical comparison.scientometrics,96,699-716.；BORNMANN,L.&MARX,W.2014.The Wisdom of Citing Scientists.Journal of theAssociation for Information Science and Technology,65,1288-1292.)，有效地克服了基于论文被引频次的引用标准化方法所存在的实质性缺陷，参见公式(3)和(4)。

c为论文i的被引频次，LCR_i为论文i的关联参考文献数；

c为论文i的被引频次，MLCR_i为论文i所在期刊的篇均关联参考文献数。

关联参考文献是指那些来源为期刊的论文，而且这些来源期刊是被数据库收录的(MARX,W.&BORNMANN,L.2015.On the causes of subject-specific citation rates inWeb of Science.Scientometrics,102,1823-1827.)，关联参考文献所对应的来源期刊，被称为“关联参考期刊”。本发明中，该数据库指的是WoS数据库，JCR是WoS中的期刊列表，因此本发明所述的关联参考期刊指包含在JCR列表中的期刊；c所指的被引频次是指期刊论文被WoS数据库中的期刊文献引用的次数。

SNCS₂评价体系是基于论文的关联参考文献的引用标准化方法：以期刊为单元，以其出版论文的篇均关联参考文献数作为论文的引用标准化因子。该引用标准化因子是在论文出版后就能够确定的，且是一个确切值，即不随时间变化而波动。但若以此作为引用标准化因子，风险在于：(1)期刊编辑部会限制论文的参考文献数量，以取得较小的分母MLCRi从而达到获取较高的引用影响力值SNCS₂的目的；(2)引用标准化以相同引用行为为基础，期刊不同并不意味着引用行为的不同，而基于期刊为单元计算的论文引用标准化势必造成相同引用行为的标准化因子不同的现象。因此SNCS₂不适合做综合性的、全方位的引用影响力评价，最多只适合做小范围的评价，如在一个机构内就某一个学科的引用影响力的初步评价(BORNMANN,L.&HAUNSCHILD,R.2016.Citation score normalized by citedreferences(CSNCR):The introduction of a new citation impact indicator.Journalof Informetrics,10 875-887.)。SNCS₁则是一种完全依赖于论文本身的参考文献数量的指标，因此，若以此为依据对论文的引用影响力进行评价，风险在于论文作者为了取得高引用影响力值，为降低分母值LCR，会想方设法隐藏或减少参考文献的数量。

与SNCS评价体系不同，文献(BORNMANN,L.&HAUNSCHILD,R.2016.Citation scorenormalized by cited references(CSNCR):The introduction of a new citationimpact indicator.Journal of Informetrics,10 875-887.)则以WoS的分类为基础，设置新类别来处理该分类体系中的学科重叠部分，提出了CSNCR评价体系，参见公式(5)和(6)：

CSNCR评价体系以相同研究领域内论文的篇均关联参考文献数R作为论文的引用期望值e_i(即论文的期望被引频次)，以论文的被引频次c_i与e_i之比CSNCR作为评价论文引用影响力的指标。在该评价体系中，论文的引用期望值e_i是其引用标准化因子，e_i在论文出版后就确定的，不随时间变化而波动，也是一种基于论文的关联参考文献的引用标准化方法。不过，该评价体系是以WoS学科分类为基础的，在期刊单元下对论文进行评价。众所周知，分类体系中学科边界是很难确定的，确定学科边界所采用的标准不同会直接导致标准化因子的差异，从而导致评价结果的差异。而且，该分类体系中存在不少的非面向学术的“特殊”期刊(WALTMAN,L.&VAN ECK,N.J.2013.Source normalized indicators of citationimpact:an overview of different approaches and an empiricalcomparison.scientometrics,96,699-716.)，贸易期刊如“professional engineering”，通读性杂志如“new scientist”，这些期刊的引用率相当低，参考文献数量很少，其所属的学科的平均值被大大拉低，因此与这些期刊同属一个学科类别的其他学术类期刊的就会被赋予较高的引用影响力值。

文献(ZITT,M.2010.Citing-side normalization of journal impact:A robustvariant of the Audience Factor.Journal of Informetrics,4,392-406.)为设计和计算期刊的受众因子(Audience Factor)构建了期刊引用网络，采用了双层“邻居”结点的期刊聚类算法，并实证研究和分析了该期刊引用网络的构建方法及期刊聚类算法。文献(Zitt,2010)认为，期刊引用网络中的期刊聚类是特定研究领域中具有特定引用行为和引用习惯的学术共同体，而相同的学术共同体具有相同的引用行为。以期刊所处的学术共同体作为依据区分引用行为的学术思想，跳出了以学科为依据划分引用行为的窠臼，克服了学科依赖的引用标准化因子计算中的缺陷。但该研究只涉及了期刊评价，没有深入到引用影响力评价中的基本单元和核心元素——论文。

发明内容

本申请的发明目的是提供一种非学科依赖的论文引用影响力标准化方法。

为实现上述发明目的，本申请的技术方案如下：

一种非学科依赖的论文引用影响力标准化方法，包括以下步骤：

(1)根据式(7)计算期刊m中论文i的引用期望值

式(7)中，n表示期刊m中的总论文数，LCR_i表示论文i的关联参考文献数；

(2)构建基于期刊m的期刊引用网络的学术共同体，在该学术共同体中，计算期刊m中论文引用影响力的修正因子β，该修正因子β与期刊m在该学术共同体中的引用影响力互为倒数；

(3)根据式(8)计算论文i的引用标准化因子λ：

(4)根据式(13)计算论文i的引用影响力CSCN_i：

式(13)中，c_i表示期刊m中论文i的被引频次。

相同引用行为界定是引用标准化因子的计算和引用影响力的评价中的基础和前提，根据文献(ZITT,M.2010.Citing-side normalization of journal impact:A robustvariant of the Audience Factor.Journal of Informetrics,4,392-406.)研究结果，以期刊引用网络的二层“邻居”结点期刊构成的学术共同体为依据界定引用行为相同与否，真实有效，可靠性强。因此本申请依据期刊的引用关系、采用双层“邻居”结点算法构建具有相同引用行为的期刊的学术共同体。在这个学术共同体内对期刊m的论文i的引用影响力进行评价，克服了学科依赖的引用影响力评价中的缺陷：基于具有相同引用行为的学术共同体计算论文引用影响力的修正因子β，而修正因子β的大小即取决于期刊m在该学术共同体中的引用影响力的相对大小。β越小，则越大；反之则越小。即为期刊m在该学术共同体中的引用影响力，β体现了不同引用影响力的期刊m及其学术共同体对期刊m中的论文i的引用影响力值的影响。利用对进行修正，则在对论文i的引用影响力进行评价时，论文不再是孤立的、不再是脱离期刊的，而是跟论文所处期刊以及该期刊所处的学术共同体的引用影响力相挂钩的，即论文自身的被引频次、出版该论文的期刊和出版该论文的期刊所处的学术共同体三者共同构成了论文的引用影响力的评价值。这就避免单纯以作为引用标准化因子可能导致的在具有相同引用行为的、低引用影响力的期刊中的较低被引频次的论文的引用影响力的评价值反而比高引用影响力的期刊中较高被引频次的论文的引用影响力的评价值还要高的风险，确保对论文的引用影响力作出合理、公正的评估。

在上述的非学科依赖的论文引用影响力标准化方法中，步骤(2)中，所述的期刊引用网络为双层“邻居”结点网络。根据文献(Zitt,2010)的研究，被引的关联参考期刊数量在双层“邻居”结点中的分布趋于近似的正态分布，这说明期刊引用网络的双层“邻居”结点对相同引用行为的界定是可行的，且具有泛化性；所以本申请中构建双层“邻居”结点网络即可获得一定的准确度。

在上述的非学科依赖的论文引用影响力标准化方法中，所述的学术共同体的构建方法包括以下步骤：

(2.1)在数据库中设定期刊m的出版时间窗口t和引用时间窗口T，获取期刊m的关联参考文献所对应的关联参考期刊，形成期刊m的期刊引用网络；

(2.2)根据期刊m的期刊引用网络中所示的引用关系，制作期刊m与关联参考期刊的引证期刊矩阵，根据式(12)计算期刊m与其关联参考期刊之间的引用强度，选取引用强度为top N的N种关联参考期刊作为一级邻居结点期刊k(1)；

式(12)中，l表示期刊m的期刊引用网络中的关联参考期刊，D_ml表示期刊m与期刊l之间的引用强度，cit_ml表示期刊l被期刊m引用的次数，cit(m)_out表示期刊m的关联参考文献数，cit(m)_in表示期刊l的总被引用频次；

(2.3)在与期刊m相同的出版时间，获取各一级邻居结点期刊k(1)的出版论文，并获取这些出版论文的关联参考文献所对应的关联参考期刊，形成各一级邻居结点期刊k(1)的期刊引用网络；

(2.4)根据各一级邻居结点期刊k(1)的期刊引用网络中所示的引用关系，制作各一级邻居结点期刊k(1)与其关联参考期刊的引证期刊矩阵，根据式(12)计算每个一级邻居结点期刊k(1)与其关联参考期刊之间的引用强度，为每个一级邻居结点期刊选取引用强度为top M的M种关联参考期刊作为二级邻居结点期刊k(2)；

由此获得所述的学术共同体。

确定关联参考期刊并构建期刊m与关联参考期刊的引证期刊矩阵后，根据式(12)计算各关联参考期刊与期刊m之间的引用强度，选取引用强度为top N的关联参考期刊作为一级邻居结点期刊k(1)，二级邻居结点期刊k(2)也通过同样的方式获得；这是为了确保期刊引用网络中期刊与期刊之间的引用关系是相对较强的，期刊与期刊之间的关系最为紧密，能够获得对期刊m的影响力最为真实的评价结果，而这是获得合理准确的论文引用影响力数据的坚实基础。

在上述的非学科依赖的论文引用影响力标准化方法中，N和M都是可变参数，评价者可以根据实际需要确定N和M的具体值。作为优选，步骤(2.2)中，N＝5～10；优选为N＝5～8；步骤(2.4)中，0＜M≤N。根据文献(ZITT,M.2010.Citing-side normalization ofjournal impact:A robust variant of the Audience Factor.Journal ofInformetrics,4,392-406.)的实证研究，N＝10、关联参考期刊5967种的实证研究结果表明，双层“邻居”结点的期刊分布呈现出近似正态分布的特征；因此采用双层“邻居”结点的期刊所构建的期刊引用网络作为与期刊m具有相同引用行为的算法具有合理性。

根据文献(Zitt,2010)的研究，N选取5～8时，双层“邻居”结点的期刊分布已经呈现出近似正态分布的特征，本申请借用该文献研究的成果，N取5～8。应当指出的是，M是一个变量，同时，不同二级邻居结点期刊k(2)所对应的二级邻居结点期刊k(2)的数量可以是相同的，也可以是不同的。

在上述的非学科依赖的论文引用影响力标准化方法中，本申请提供了四种计算修正因子β的方法。

其一：所述的修正因子β的计算方法如式(9)所示：

式(11)中，RFV_l表示期刊l的参考期刊值，RFV_m表示期刊m的参考期刊值；k表示期刊m的引用网络的双层“邻居”结点聚类中的总关联参考期刊数。

在上述的非学科依赖的论文引用影响力标准化方法中，参考期刊值的计算方法如式(10)和式(11)所示：

式(10)和式(11)中，RFV表示期刊的参考期刊值，g表示期刊的关联参考文献，G表示期刊的总关联参考文献数，JIF_g和CHL_g分别表示g所对应的关联参考期刊的去自引影响因子和被引端半衰期。

由式(10)和式(11)可见，期刊的参考期刊值的大小是由期刊的关联参考期刊的去自引影响因子和该期刊的被引端半衰期的标准值决定的。众所周知，在给定年度，期刊的去自引影响因子和被引端半衰期都是一个恒定的确切值，是成熟的且为学术界所广泛认可和接受的。对于期刊而言，利用其关联参考期刊(关联参考文献的来源期刊)的去自引影响因子和被引端半衰期之比获得的参考期刊值，是不会随时间推移而变化的，在期刊出版后就能够确定的。根据申请号为201811478179.6的中国发明专利申请公开的内容，期刊的参考期刊值与其长引用时间窗口的被引频次存在着统计学上显著的超强相关性。因此根据参考期刊值的大小即能够确定期刊的引用影响力的相对高低，也即在具有相同引用行为的期刊集合——学术共同体中，采用期刊的参考期刊值能十分准确地对期刊的引用影响力进行实时评估。因此，据此计算获得的修正因子真实准确，评估结果科学有效。

其二：所述的修正因子β的计算方法如式(9a)所示：

式(9a)中，LCR_l表示期刊l的关联参考文献数，LCR_m表示期刊m的关联参考文献数，k表示期刊引用网络中的总关联参考期刊数，即为k(1)与k(2)的数量之和。

与期刊的参考期刊值相类似，一旦期刊出版，期刊的关联参考文献数就是一个确切值，因此采用期刊的关联参考文献数也能及时地对期刊的引用影响力进行实时评估，计算获得的修正因子真实准确，评估结果科学有效。不过，根据申请号为201811478179.6的中国发明专利申请公开的内容，期刊在长引用时间窗口内的被引频次与其参考期刊值之间呈现出显著的强相关关系，表明期刊的参考期刊值对其被引频次具有很强的预测能力，因此用期刊的参考期刊值来标准化期刊的引用影响力较之单纯的关联参考文献数量，更能反映出该期刊的引用潜力。

文献(ABRAMO,G.,CICERO,T.&D'ANGELO,C.A.2011.Assessing the varyinglevel of impact measurement accuracy as a function of the citation windowlength.Journal of Informetrics,5,659-667.；ABRAMO,G.,D'ANGELOB,C.A.&FELICI,G.2019.Predicting publication long-term impact through a combination of earlycitations and journal impact factor.Journal of Informetrics,13 32-49.；GLANZEL,W.,SCHLEMMER,B.&THIJS,B.2003.Better late than never？On the chance tobecome highly cited only beyond the standard bibliometric timehorizon.Scientometrics,58,571-586.)指出，当也只有当经过一个足够长的引用时间，基于被引端的“被引”变量指标值可以作为一个可信赖的评价依据。同时也认为引文的成熟时间为2-4年左右，也即当引用时间窗口T为4年及以上时，期刊被引频次趋于稳定，可以作为期刊的引用影响力测度。

因此，本申请中，若在期刊引用的网络的聚类中，期刊的引用时间窗口T≥4年，则也可以采用第三种方法计算修正因子β。即：

其三：所述的修正因子β的计算方法如式(9b)所示：

式(9b)中，c_l(t，T)表示期刊l的被引频次，c_m(t，T)表示期刊m的被引频次，t为期刊的出版时间窗口，T为期刊的引用时间窗口，k表示期刊引用网络中的总关联参考期刊数，即为k(1)与k(2)的数量之和。

其四：所述的修正因子β的计算方法如式(9c)所示：

式(9c)中，式(9c)中，JIF_l(t，T)表示期刊l在给定年度的去自引影响因子，JIF_m(t，T)表示期刊m在给定年度的去自引影响因子，k表示期刊引用网络中的总关联参考期刊数，即为k(1)与k(2)的数量之和。

当t＝T＝2时，即为期刊的标准影响因子，或者当t＝T＝5时，即为5年期的期刊影响因子，此时可以从JCR列表中直接获取期刊的去自引影响因子；当t、T为其他的时间窗口长度时，需要计算获得。

期刊的影响因子是指在一个给定的出版时间窗口t和引用时间窗口T中，该期刊的篇均被引频次；而被引频次是指论文发表后被引用的次数，这就使得影响因子与被引频次一样具有时间滞后性的缺陷，因此，式(9b)和(9c)适合评价较早出版的论文。

在获取二级邻居结点期刊k(2)后，在期刊m的出版年度重新下载该二级邻居结点期刊k(2)，获取该年度的数据。自此，期刊m、一级邻居结点期刊k(1)和二级邻居结点期刊k(2)的数据都来自相同的出版年度；而后再计算修正因子β。比如，期刊m是2018年出版的，而关联参考期刊的出版时间基本上或大多数都是2018年之前的，可能是2000年、2010年、2015年、2016年等等，此时，在计算关联参考期刊的参考期刊值、关联参考文献数、被引频次或去自引影响因子时，需要利用2018年获得的数据进行。

与现有技术相比，本申请的有益效果体现在：

本申请依据期刊的引用关系构建了期刊引用网络，形成了具有相同引用行为的期刊的学术共同体，在这个期刊的学术共同体内对期刊m的论文i的引用影响力进行评价克服了与学科完全一致的引用行为划分的缺陷，利用期刊引用网络可以使真正具有相同引用行为的期刊聚集在一起形成学术共同体。在学术共同体内计算期刊m中论文i引用影响力的修正因子β，而修正因子β的大小即取决于期刊m在该学术共同体中的引用影响力的相对大小，即β越小，越大，即为期刊m在该学术共同体中的引用影响力。β体现了不同引用影响力的期刊对论文的引用影响力的影响，利用对进行修正，则在对论文i的引用影响力进行评价时，评价结果取决于三个方面：论文自身的被引频次，论文在期刊中的引用影响力的相对大小和该期刊在其学术共同体中的引用影响力的相对大小；论文不再是孤立的、不再是脱离期刊的，而是跟期刊的引用影响力和价值相挂钩的，这就避免了单纯以作为引用标准化因子可能导致的在具有相同引用行为的、低影响力的期刊中的较低被引频次的论文的引用影响力反而比高影响力的期刊中较高被引频次的论文的引用影响力还要高的风险，确保对论文的引用影响力作出合理、公正的评估。

附图说明

图1为本申请一种非学科依赖的论文引用影响力标准化方法中构建的学术共同体的结构示意图。

具体实施方式

下面结合附图和具体实施方式对本发明的技术方案做进一步详细说明。

实施例1

本实施例一种非学科依赖的论文引用影响力标准化方法，包括以下步骤：

(1)根据式(7)计算期刊m中论文i的引用期望值

(2)构建期刊m的期刊引用网络，根据该期刊引用网络计算期刊m引用影响力的修正因子β，该修正因子β与期刊m在该期刊引用网络中的引用影响力互为倒数；

具体包括：

(2.2)根据期刊m的期刊引用网络中所示的引用关系，制作期刊m与关联参考期刊的引证期刊矩阵，根据式(12)计算期刊m与其关联参考期刊之间的引用强度，选取引用强度为top N的N种(本实施例中N为5)关联参考期刊作为一级邻居结点期刊k(1)；

(2.3)在与期刊m相同的出版时间内，获取各一级邻居结点期刊k(1)的出版论文，并获取这些出版论文的关联参考文献所对应的关联参考期刊，形成各一级邻居结点期刊k(1)的期刊引用网络；

(2.4)根据各一级邻居结点期刊k(1)的期刊引用网络中所示的引用关系，制作各一级邻居结点期刊k(1)与其关联参考期刊的引证期刊矩阵，根据式(12)计算每个一级邻居结点期刊k(1)与其关联参考期刊之间的引用强度，为每个一级邻居结点期刊选取引用强度为top M的M种(本实施例中M为4)关联参考期刊作为二级邻居结点期刊k(2)；

如图1所示，由此获得学术共同体；

(2.5)根据式(9)计算修正因子β：

式(9)中，RFV_l表示期刊l的参考期刊值，RFV_m表示期刊m的参考期刊值，k表示期刊引用网络中的总关联参考期刊数，即为k(1)与k(2)的数量之和；

期刊的参考期刊值的计算方法参见申请号为201811478179.6的中国发明专利申请，如式(10)和式(11)所示：

式(10)和式(11)中，RFV表示期刊的参考期刊值，g表示期刊的关联参考文献，G表示期刊的总关联参考文献数，JIF_g和CHL_g分别表示g所对应的关联参考期刊的去自引影响因子和被引端半衰期。；RFV_l和RFV_m均可参照上式进行计算；

(3)根据式(8)计算引用标准化因子λ：

(4)根据式(13)计算论文i的引用影响力CSCN_i：

式(13)中，c_i表示期刊m中论文i的被引频次。

Claims

1.一种非学科依赖的论文引用影响力的标准化方法，其特征在于，包括以下步骤：

(1)根据式(7)计算期刊m中论文i的引用期望值

(3)根据式(8)计算论文i的引用标准化因子λ：

(4)根据式(13)计算论文i的引用影响力CSCN_i：

式(13)中，c_i表示期刊m中论文i的被引频次。

2.如权利要求1所述的非学科依赖的论文引用影响力标准化方法，其特征在于，步骤(2)中，所述的期刊引用网络为双层邻居结点网络。

3.如权利要求2所述的非学科依赖的论文引用影响力标准化方法，其特征在于，所述的学术共同体的构建方法包括以下步骤：

由此获得所述的学术共同体。

4.如权利要求3所述的非学科依赖的论文引用影响力标准化方法，其特征在于，步骤(2.4)中，0＜M≤N。

5.如权利要求3所述的非学科依赖的论文引用影响力标准化方法，其特征在于，所述的修正因子β的计算方法如式(9)所示：

式(9)中，RFV_l表示期刊l的参考期刊值，RFV_m表示期刊m的参考期刊值；k表示学术共同体中的总关联参考期刊数。

6.如权利要求5所述的非学科依赖的论文引用影响力标准化方法，其特征在于，期刊的参考期刊值的计算方法如式(10)和式(11)所示：

7.如权利要求3所述的非学科依赖的论文引用影响力标准化方法，其特征在于，所述的修正因子β的计算方法如式(9a)所示：

式(9a)中，LCR_l表示期刊l的关联参考文献数，LCR_m表示期刊m的关联参考文献数，k表示期刊引用网络中的总关联参考期刊数。

8.如权利要求3所述的非学科依赖的论文引用影响力标准化方法，其特征在于，所述的修正因子β的计算方法如式(9b)所示：

式(9b)中，c_l(t，T)表示期刊l的被引频次，c_m(t，T)表示期刊m的被引频次，k表示期刊引用网络中的总关联参考期刊数。

9.如权利要求3所述的非学科依赖的论文引用影响力标准化方法，其特征在于，所述的修正因子β的计算方法如式(9c)所示：

式(9c)中，JIF_l(t，T)表示期刊l在给定年度的去自引影响因子，JIF_m(t，T)表示期刊m在给定年度的去自引影响因子，k表示期刊引用网络中的总关联参考期刊数。

10.如权利要求5-9中任意一项所述的非学科依赖的论文引用影响力标准化方法，其特征在于，用于计算所述的修正因子β的各参数取自与期刊m相同的出版年度。