CN108846019A - 一种基于黄金引用算法的论文排序方法 - Google Patents

一种基于黄金引用算法的论文排序方法 Download PDF

Info

Publication number
CN108846019A
CN108846019A CN201810432864.9A CN201810432864A CN108846019A CN 108846019 A CN108846019 A CN 108846019A CN 201810432864 A CN201810432864 A CN 201810432864A CN 108846019 A CN108846019 A CN 108846019A
Authority
CN
China
Prior art keywords
paper
group
paper group
revision
draw
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810432864.9A
Other languages
English (en)
Other versions
CN108846019B (zh
Inventor
吴晨生
杜丽萍
李梦辉
刘静
黄玉荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Original Assignee
BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE filed Critical BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Priority to CN201810432864.9A priority Critical patent/CN108846019B/zh
Publication of CN108846019A publication Critical patent/CN108846019A/zh
Application granted granted Critical
Publication of CN108846019B publication Critical patent/CN108846019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Paper (AREA)

Abstract

本发明公开了一种基于黄金引用算法的论文排序方法,包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;再次,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;然后,以自引修订论文群体为初始论文群体,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,并进行降序排列;最后,输出排序结果。通过标定论文的引用属性,排除论文引用关系中自引的干扰,再依据自引修订引用次数,逐层提取论文群体中的论文组合成新的论文群体,并进行依次排序,依据排序结果使得用户直观的获取论文群体的分布情况,实现用户快速、准确的检索到高质量论文。

Description

一种基于黄金引用算法的论文排序方法
技术领域
本发明属于大数据论文检索推荐技术领域,具体地说涉及一种基于黄金引用算法的论文排序方法。
背景技术
学术论文的评价和学术论文的排序,作为论文检索和论文推荐系统的核心部分,一直以来都是研究人员非常关心的问题。因为,准确的学术论文评价和排序意义非常重大,例如,准确的学术论文评价和排序可以辅助量化研究人员的科研影响力,以及学术机构的科研影响力等,以及加快入门学者对于特定科学领域的学习速度。
现有技术公开了一种引文数据库中主题文献学术影响力的分析与排序方法,包括:在引文数据库中进行主题检索,获取主题文献元数据信息及主题文献间引用关系;根据获取的主题文献元数据信息及主题文献间引用关系构建主题引文网络;基于主题引文网络构建包含文献学术影响力多因素的因子图模型;使用循环最大和算法在因子图上近似推理,确定因子图中所有变量的边缘概率值;根据边缘概率值的降序排序结果,获取并输出所有主题文献的学术影响力排序。该申请只考虑了论文之间的引用关系,但因自引论文的干扰并不能完全体现论文的质量。
有鉴于此特提出本发明。
发明内容
本发明要解决的技术问题在于克服现有技术的不足,提供一种基于黄金引用算法的论文排序方法,通过黄金引用算法排除自引论文的干扰,进一步对论文群体进行筛选排序,实现用户快速、准确的检索到高质量论文。
为解决上述技术问题,本发明采用技术方案的基本构思是:一种基于黄金引用算法的论文排序方法,包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;再次,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;然后,以自引修订论文群体为初始论文群体,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,并进行降序排列;最后,输出排序结果。本申请中的黄金引用算法模型,排除了引用次数中的自引,从而避免了自引在论文评价中的干扰,又以自引修订论文群体为初始群体,依据他引次数逐层迭代筛选出边缘论文,并将删除的论文组合成新的论文群体,并对这些论文群体按照降序排列,使得引用次数统计中他引情况更加直观,用户通过排序结果可准确的识别、并获取高质量论文,并且该算法简单、易于实行,用户运用本算法对论文群体中的高质量论文进行统计、计算较为方便。
进一步,所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文与论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系。
进一步,引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;
在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为
进一步,所述标定论文引用属性,步骤如下:根据论文作者判定论文的引用关系是自引还是他引,若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引。
进一步,依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1,其中,λi,j为自引系数,i≥1,j≥1。
进一步,论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1。
进一步,依据自引修订引用次数为生成自引修订论文群体G',从而构建出自引修订网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络。
进一步,引入被引次数设定值k,k依次由小到大取值,采用迭代筛选的方式逐层缩小论文群体的范围,将每层筛选出的论文组成论文群体,并进行排序,直至输出全部的排序结果,其中,k为整数,且k≥0。
进一步,第k层的初始论文群体为Gk时,Gk中含有|Vk|=Nk个节点,即含有Nk篇论文,|Ek|=Mk条边,第i篇论文在论文群体Gk中的被引次数关系式为
采用迭代筛选的方式缩小Gk的范围,筛选出Gk中被引次数等于k的论文及其引用关系,生成论文群体Gk,1,第i篇论文在论文群体Gk,1中的被引次数关系式为继续筛选出Gk,1小于和/或等于k的论文及其引用关系,并生成论文群体Gk,2,继续迭代筛选,直至生成论文群体Gk,q,且Gk,q中论文被至少k+1篇Gk,q中的论文引用,形成第k+1层的初始论文群体,即Gk,q记作Gk+1
每层迭代筛选出的论文组成论文群体Dk,筛选后的论文群体Gk+1中含有|Vk+1|=Nk+1个节点,即含有Nk+1篇论文,|Ek+1|=Mk+1条边,第i篇论文在论文群体Gk+1中的被引次数关系式为且被引次数大于k,其中,k、q为整数,且k≥0,q≥1。
进一步,以自引修订论文群体G'为初始论文群体,G0=G',对每层迭代筛选出的论文群体进行降序排列,直至输出全部的排序结果,具体步骤如下所示:
S31.k=0,筛选出G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续筛选出G0,1等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代筛选,直至生成论文群体G0,q,且G0,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代筛选出的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为其中,q为整数,且q≥1;
S32.k=1,筛选出论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续迭代筛选出G1,1中论文小于和/或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代筛选,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代筛选出的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;
S33.k=2,筛选出G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续筛选出G2,1小于和/或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代筛选,直至生成论文群体G2,q,且G2,q中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代筛选出的论文组成论文群体为D2,论文群体缩小为G3,含有论文数量为|V3|=N3篇,第i篇论文在论文群体G3中的被引次数关系式为其中,q为整数,且q≥1;
S34.依照步骤S11-S13,继续逐层迭代筛选出边缘论文,当k=n时,筛选出Gn中自引修订引用次数等于n的论文及其引用关系,生成论文群体Gn,1,第i篇论文在论文群体Gn,1中的被引次数关系式为继续筛选Gn,1小于和/或等于n的论文及其引用关系,并生成论文群体Gn,2,继续迭代筛选,直至生成论文群体Gn,q,且Gn,q中论文被其他至少n+1篇Gn,q中的论文引用,其中Gn,q记作Gn+1,迭代筛选的论文组成论文群体为Dn,论文群体缩小为Gn+1,Gn+1含有论文数量为|Vn+1|=Nn+1篇论文,其中n,q为整数,且n≥0,q≥1;
S35.当Nn+1=0时,终止筛选论文节点,输出论文群体排序结果,其中排序结果为:{Dn、Dn-1……D2、D1、D0};
论文的原始引用次数统计是将每次被引用记录均记为1,通过论文作者对引用关系进一步地限定,排除论文引用关系中自引的干扰,再根据施引论文的被引情况修订论文的引用次数,得出论文群体中论文的他引次数,以自引修订论文群体G'为初始论文群体,依据自引修订引用次数,采用逐层迭代筛选的方式,逐层筛选出论文群体的边缘的论文,将筛选出的论文组成论文群体,并进行降序排列,用户通过排序结果获取所需的论文文献,实现用户快速、准确的检索到高质量论文;从而依据论文网络中他引次数的排序结果获取高质量论文的方法更加合理。
采用上述技术方案后,本发明与现有技术相比具有以下有益效果:
1、通过构建论文群体初始引用网络模型,基于论文引用次数识别高质量论文,使得论文群中论文相互之间的引用关系更加具体直观,且计算过程快速便捷,选出的论文群体具有较高的权威性。
2、实施自引修订引用次数,排除了引用次数中的自引用论文,克服了自引在论文评价中的干扰,使得评估出的论文质量更加合理;同时,逐层迭代筛选的方式,逐层筛选出论文群体的边缘论文,将筛选出的论文组成论文群体,并进行排序,使得论文群体中论文的他引关系更加直观;综合考虑作者自引和施引论文质量不均等因素,对论文的初始的引用次数进行统计修订,提高推荐系统识别高质量论文的准确性。
下面结合附图对本发明的具体实施方式作进一步详细的描述。
附图说明
附图作为本发明的一部分,用来提供对本发明的进一步的理解,本发明的示意性实施例及其说明用于解释本发明,但不构成对本发明的不当限定。显然,下面描述中的附图仅仅是一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。在附图中:
图1是本发明中一种基于黄金引用算法的论文排序方法流程示意图;
图2是本发明中一种基于黄金引用算法的论文推荐方法流程示意图;
图3是本发明中一种应用黄金引用论文算法的流程示意图;
图4是本发明中论文群体初始引用网络模型示意图;
图5是本发明中递归缩小自引修订论文群体的数量统计示意图。
需要说明的是,这些附图和文字描述并不旨在以任何方式限制本发明的构思范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
实施例一
如图2至图5所示,本发明介绍了一种基于黄金引用算法的论文推荐方法,首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;然后,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;最后,迭代的缩小自引修订论文群体的范围,直至结果收敛,得出黄金引用论文。实施自引修订引用次数,排除了引用次数中的自引用论文,克服了自引在论文评价中的干扰,使得评估出的论文质量更加合理;同时,采用迭代删除的方式,逐层排除自引修订引用次数统计中低质低效的他引干扰;综合考虑作者自引和低质量论文引用的干扰因素,对论文的初始的引用次数进行统计修订,提高推荐系统识别高质量论文的准确性。
如图2所示,本实施例中,具体包括以下步骤:
S1.在论文数据库中选定论文群体范围;
S2.构建选定论文群体的初始引用网络模型;
如图3所示,构建论文引用网络,论文群体G=(V,E)是由|V|=N个顶点和|E|=M条边所组成的一个有向网络,其中,G代表论文群体中论文与论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系;
引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;
在论文群体G中以第i篇论文为节点的引用次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的引用次数关系式为
S3.标定引用属性,建立自引修订引用网络;
首先,根据论文的作者判断论文之间的引用关系是自引还是他引;若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引;
其次,依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1;其中,i≥1,j≥1;在Ei中引入自引系数λi,j,删除初始引用网络模型中第i篇论文的自引引用关系,获得第i篇论文在论文群体中的他引引用关系;
最后,论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1;则第i篇论文在论文群体中的自引修订引用次数为
依据自引修订引用次数生成自引修订论文群体G',从而构建出自引修订网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络。
如图4所示,引入被引次数设定值k,k依次由小到大取值,采用迭代删除的方式逐层缩小论文群体的范围,直至结果收敛,其中,k为整数,且k≥0。
S4.以自引修订论文群体G'为初始论文群体,G0=G',采用迭代删除的方式逐层缩小论文群体的范围,当k大于和/或等于n时,终止删除论文节点,论文群体收敛,得出黄金引用论文,其中n为整数,且n≥0,具体包括以下步骤:
如图2所示,具体步骤如下:
S11.k=0,删除G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续删除G0,1等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代删除,直至生成论文群体G0 ,q,且G0,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代删除的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为其中,q为整数,且q≥1;
S12.k=1,删除论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续删除G1,1小于和/或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代删除,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代删除的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;
S13.k=2,删除G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续删除G2,1小于和/或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代删除,直至生成论文群体G2,q,且中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代删除的论文组成论文群体为D2,论文群体缩小为G3,含有论文数量为|V3|=N3篇,第i篇论文在论文群体G3中的被引次数关系式为其中,q为整数,且q≥1;
S14.依照步骤S11-S13,继续迭代删除边缘论文,当k=n时,删除Gn中自引修订引用次数等于n的论文及其引用关系,生成论文群体Gn,1,第i篇论文在论文群体Gn,1中的被引次数关系式为继续删除Gn,1小于和/或等于n的论文及其引用关系,并生成论文群体Gn,2,继续迭代删除,直至生成论文群体Gn,q,且Gn,q中论文被其他至少n+1篇Gn,q中的论文引用,其中Gn,q记作Gn+1,迭代删除的论文组成论文群体为Dn,论文群体缩小为Gn+1,Gn+1含有论文数量为|Vn+1|=Nn+1篇为黄金引用论文,其中n,q为整数,且n≥0,q≥1;
优选的,依照步骤S11-S13,k继续依次由小到大取值,Nn-1-Nn小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,Gn含有论文数量为|Vn|=Nn篇为黄金引用论文,其中n为整数,且n≥0;。
优选的,依照步骤S11-S13,k继续依次由小到大取值,Nn小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,Gn含有论文数量为|Vn|=Nn篇为黄金引用论文,其中n为整数,且n≥0;
优选的,依照步骤S11-S13,k继续依次由小到大取值,小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,Gn含有论文数量为|Vn|=Nn篇为黄金引用论文,其中n为整数,且n≥0。
S5.输出黄金引用论文。
本实施例中,步骤S1中论文群体可以是按照主题、领域、学科和/或年代划定范围,也可以是按照设定的检索策略划定范围,也可以是数据库中的全部论文。
本实施例中,以主题为马克思的论文群体为例,首先选定论文群体主题为马克思的论文,含有论文17260篇;依据自引修订引用次数删除初始引用网络模型中的自引用关系;然后迭代的删除论文群体中的边缘论文,即排除低质低效他引论文;最后收敛结果获得163篇黄金引用论文推荐给用户。
本实施例中,以主题为航空航天的论文群体为例,首先选定论文群体主题为航空航天的论文,含有论文20781篇;依据自引修订引用次数删除初始引用网络模型中的自引用关系;然后迭代的删除论文群体中的边缘论文,即排除低质低效他引论文;最后收敛结果获得461篇黄金引用论文推荐给用户。
实施例二
如图1所示,本发明实施例中介绍了一种基于黄金引用算法的论文排序方法,包括以下步骤:
S11.在论文数据库中选定论文群体范围;
S12.利用选定论文群体中论文的相互引用关系构建初始引用网络模型;
S13.标定初始引用网络模型中论文的引用属性,并通过论文的自引系数修订引用次数,生成自引修订论文群体;
S14.以自引修订论文群体为初始论文群体,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,并进行降序排列;
S15.输出排序结果。
本实施例中,论文群体可以是按照主题、领域、学科和/或年代划定范围,或者是按照设定的检索策略划定范围,或者是数据库中的全部论文;
本实施例中,所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文以及论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系。
本实施例中,引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;
在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为
本实施例中,标定论文引用属性,步骤如下:根据论文的作者判断论文之间的引用关系是自引还是他引;若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引;
依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1;其中,i≥1,j≥1;。在Ei中引入自引系数λi,j,删除初始引用网络模型中第i篇论文的自引引用关系,获得第i篇论文在论文群体中的他引引用关系。
本实施例中,论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1。
本实施例中,依据自引修订引用次数为生成自引修订论文群体G',从而构建出自引用网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络。
本实施例中,引入被引次数设定值k,k依次由小到大取值,依据k值采用迭代筛选的方式逐层缩小论文群体的范围,将每层筛选出的论文组成论文群体,并进行排序,直至输出全部的排序结果,其中,k为整数,且k≥0。
本实施例中,第k层的初始论文群体为Gk时,Gk中含有|Vk|=Nk个节点,即含有Nk篇论文,|Ek|=Mk条边,第i篇论文在论文群体Gk中的被引次数关系式为
采用迭代筛选的方式缩小Gk的范围,筛选出Gk中被引次数等于k的论文及其引用关系,并生成论文群体Gk,1,第i篇论文在论文群体Gk,1中的被引次数关系式为继续筛选出Gk,1小于和/或等于k的论文及其引用关系,并生成论文群体Gk,2,继续迭代筛选,直至生成论文群体Gk,q,且Gk,q中论文被至少k+1篇Gk,q中的论文引用,形成第k+1层的初始论文群体,即Gk,q记作Gk+1
每层迭代筛选出的论文组成论文群体Dk,筛选后的论文群体Gk+1中含有|Vk+1|=Nk+1个节点,即含有Nk+1篇论文,|Ek+1|=Mk+1条边,第i篇论文在论文群体Gk+1中的被引次数关系式为且被引次数大于k,其中,k、q为整数,且k≥0,q≥1。
本实施例中,以自引修订论文群体G'为初始论文群体,G0=G',对每层迭代筛选出的论文群体进行降序排列,直至输出全部的排序结果,具体步骤如下所示:
S31.k=0,筛选出G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续筛选出G0,1等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代筛选,直至生成论文群体G0,q,且G0,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代筛选出的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为,其中,q为整数,且q≥1;
S32.k=1,筛选出论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续迭代筛选出G1,1小于和/或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代筛选,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代筛选出的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;
S33.k=2,筛选出G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续筛选出G2,1小于和/或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代筛选,直至生成论文群体G2,q,且G2,q中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代筛选出的论文组成论文群体为D2,论文群体缩小为G3,含有论文数量为|V3|=N3篇,第i篇论文在论文群体G3中的被引次数关系式为其中,q为整数,且q≥1;
S34.依照步骤S11-S13,继续逐层迭代筛选出边缘论文,当k=n时,筛选出Gn中自引修订引用次数等于n的论文及其引用关系,生成论文群体Gn,1,第i篇论文在论文群体Gn,1中的被引次数关系式为继续筛选Gn,1小于和/或等于n的论文及其引用关系,并生成论文群体Gn,2,继续迭代筛选,直至生成论文群体Gn,q,且Gn,q中论文被其他至少n+1篇Gn,q中的论文引用,其中Gn,q记作Gn+1,迭代筛选的论文组成论文群体为Dn,论文群体缩小为Gn+1,Gn+1含有论文数量为|Vn+1|=Nn+1篇论文,其中n,q为整数,且n≥0,q≥1;
S35.当Nn+1=0时,终止筛选论文节点,输出论文群体排序结果,其中排序结果为:{Dn、Dn-1……D2、D1、D0};
本实施例中,k依次由小到大取值,k大于和/或等于某一设定值的论文群体进行迭代筛选出的论文为黄金引用论文,则从排序结果中由高到低依次输出论文群体,其中k为正整数,且k≥0;
优选的,小于和/或等于某一设定值时的论文群体进行迭代筛选出的论文为黄金引用论文,并将论文群体从排序结果中由高到低输出,n为整数,且n≥0;
优选的,Nn-1-Nn小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为黄金引用论文,并将论文群体从排序结果中由高到低输出,n为整数,且n≥0;
优选的,Nn小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为黄金引用论文,并将论文群体从排序结果中由高到低输出,n为整数,且n≥0。
本实施例中,用户手动按序查看,获取高质量的黄金引用论文。
论文的原始引用次数统计是将每次被引用记录均记为1,通过论文的作者对论文间的引用关系进一步地限定,排除论文引用关系中自引的干扰,再根据施引论文的被引情况修订论文的引用次数,得出论文群体中论文的他引次数,以自引修订论文群体G'为初始论文群体,依据自引修订引用次数,采用迭代筛选的方式逐层对论文群体筛选,筛选出的论文群体组合成新的论文群体,并进行降序排列,用户通过排序结果获取所需的高质量论文,增强了用户对高质量论文的自主选择性,提升用户体验。
以上所述仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专利的技术人员在不脱离本发明技术方案范围内,当可利用上述提示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明方案的范围内。

Claims (10)

1.一种基于黄金引用算法的论文排序方法,其特征在于:包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;再次,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;然后,以自引修订论文群体为初始论文群体,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,进行降序排列;最后,输出排序结果。
2.根据权利要求1所述的一种基于黄金引用算法的论文排序方法,其特征在于:所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文以及论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系。
3.根据权利要求1-2任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;
在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为
4.根据权利要求1-3任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:所述标定论文引用属性,步骤如下:根据论文作者判定论文的引用关系是自引还是他引,若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引。
5.根据权利要求1-4任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1;其中,λi,j为自引系数,i≥1,j≥1。
6.根据权利要求1-5任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1。
7.根据权利要求1-6任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:依据自引修订引用次数为生成自引修订论文群体G',从而构建出自引修订网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络。
8.根据权利要求1-7任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:引入被引次数设定值k,k依次由小到大取值,采用迭代筛选的方式逐层缩小论文群体的范围,将每层筛选出的论文组成论文群体,并进行排序,直至输出全部的排序结果,其中,k为整数,且k≥0。
9.根据权利要求1-8任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:第k层的初始论文群体为Gk时,Gk中含有|Vk|=Nk个节点,即含有Nk篇论文,|Ek|=Mk条边,第i篇论文在论文群体Gk中的被引次数关系式为
采用迭代筛选的方式逐层缩小Gk的范围,筛选出Gk中被引次数等于k的论文及其引用关系,生成论文群体Gk,1,第i篇论文在论文群体Gk,1中的被引次数关系式为继续筛选出Gk,1小于或等于k的论文及其引用关系,并生成论文群体Gk,2,继续迭代筛选,直至生成论文群体Gk,q,且Gk,q中论文被至少k+1篇Gk,q中的论文引用,形成第k+1层的初始论文群体,即Gk,q记作Gk+1
每层迭代筛选出的论文组成论文群体Dk,筛选后的论文群体Gk+1中含有|Vk+1|=Nk+1个节点,即含有Nk+1篇论文,|Ek+1|=Mk+1条边,第i篇论文在论文群体Gk+1中的被引次数关系式为且被引次数大于k,其中,k、q为整数,且k≥0,q≥1。
10.根据权利要求1-9任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:以自引修订论文群体G'为初始论文群体,G0=G',对每层迭代筛选出的论文群体进行降序排列,直至输出全部的排序结果,具体步骤如下所示:
S31.k=0,筛选出G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续筛选出G0,1中Ei 0,1等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代筛选,直至生成论文群体G0 ,q,且G0,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代筛选出的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为其中,q为整数,且q≥1;
S32.k=1,筛选出论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续迭代筛选出G1,1小于和/或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代筛选,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代筛选出的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;
S33.k=2,筛选出G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续筛选出G2,1小于和/或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代筛选,直至生成论文群体G2,q,且G2,q中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代筛选出的论文组成论文群体为D2,论文群体缩小为G3,含有论文数量为|V3|=N3篇,第i篇论文在论文群体G3中的被引次数关系式为其中,q为整数,且q≥1;
S34.依照步骤S11-S13,继续逐层迭代筛选出边缘论文,当k=n时,筛选出Gn中自引修订引用次数等于n的论文及其引用关系,生成论文群体Gn,1,第i篇论文在论文群体Gn,1中的被引次数关系式为继续筛选Gn,1小于和/或等于n的论文及其引用关系,并生成论文群体Gn,2,继续迭代筛选,直至生成论文群体Gn,q,且Gn,q中论文被其他至少n+1篇Gn,q中的论文引用,其中Gn,q记作Gn+1,迭代筛选的论文组成论文群体为Dn,论文群体缩小为Gn+1,Gn+1含有论文数量为|Vn+1|=Nn+1篇论文,其中n,q为整数,且n≥0,q≥1;
S35.当Nn+1=0时,终止筛选论文节点,输出论文群体排序结果,其中排序结果为:{Dn、Dn-1……D2、D1、D0}。
CN201810432864.9A 2018-05-08 2018-05-08 一种基于黄金引用算法的论文排序方法 Active CN108846019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810432864.9A CN108846019B (zh) 2018-05-08 2018-05-08 一种基于黄金引用算法的论文排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810432864.9A CN108846019B (zh) 2018-05-08 2018-05-08 一种基于黄金引用算法的论文排序方法

Publications (2)

Publication Number Publication Date
CN108846019A true CN108846019A (zh) 2018-11-20
CN108846019B CN108846019B (zh) 2019-05-21

Family

ID=64212822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810432864.9A Active CN108846019B (zh) 2018-05-08 2018-05-08 一种基于黄金引用算法的论文排序方法

Country Status (1)

Country Link
CN (1) CN108846019B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729432A (zh) * 2013-12-27 2014-04-16 河海大学 一种引文数据库中主题文献学术影响力的分析与排序方法
CN105808729A (zh) * 2016-03-08 2016-07-27 上海交通大学 基于论文间引用关系的学术大数据分析方法
CN106844665A (zh) * 2017-01-20 2017-06-13 中山大学 一种基于引用关系分布式表达的论文推荐方法
CN107341199A (zh) * 2017-06-21 2017-11-10 北京林业大学 一种基于文献信息共性模式的推荐方法
CN107463569A (zh) * 2016-06-02 2017-12-12 索意互动(北京)信息技术有限公司 一种文献分析方法与装置
CN107832412A (zh) * 2017-11-06 2018-03-23 浙江工业大学 一种基于文献引用关系的刊物聚类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729432A (zh) * 2013-12-27 2014-04-16 河海大学 一种引文数据库中主题文献学术影响力的分析与排序方法
CN105808729A (zh) * 2016-03-08 2016-07-27 上海交通大学 基于论文间引用关系的学术大数据分析方法
CN107463569A (zh) * 2016-06-02 2017-12-12 索意互动(北京)信息技术有限公司 一种文献分析方法与装置
CN106844665A (zh) * 2017-01-20 2017-06-13 中山大学 一种基于引用关系分布式表达的论文推荐方法
CN107341199A (zh) * 2017-06-21 2017-11-10 北京林业大学 一种基于文献信息共性模式的推荐方法
CN107832412A (zh) * 2017-11-06 2018-03-23 浙江工业大学 一种基于文献引用关系的刊物聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李勇等: "基于PageRank的机构科研影响力评价", 《医学信息学杂志》 *

Also Published As

Publication number Publication date
CN108846019B (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
CN104462593B (zh) 一种提供用户个性化资源消息推送的方法和装置
CN108363804A (zh) 基于用户聚类的局部模型加权融合Top-N电影推荐方法
CN107944035B (zh) 一种融合视觉特征和用户评分的图像推荐方法
CN105183748B (zh) 一种基于内容和评分的组合预测方法
CN108846056A (zh) 一种科技成果评审专家推荐方法及装置
DE102018005611A1 (de) Automatische Paarbildung von Fonts unter Verwendung des asymmetrischen Metriklernens
CN110134958B (zh) 一种基于语义词网络的短文本主题挖掘方法
CN110825850B (zh) 一种自然语言主题分类方法及装置
CN110688585B (zh) 一种基于神经网络和协同过滤的个性化电影推荐方法
CN112990284A (zh) 一种基于XGBoost算法的个体出行行为预测方法、系统及终端
CN105631018A (zh) 基于主题模型的文章特征抽取方法
CN109002524B (zh) 一种基于论文引用关系的黄金引用作者排序方法
CN110334286A (zh) 一种基于信任关系的个性化推荐方法
CN107180078A (zh) 一种基于用户兴趣学习的垂直搜索方法
CN108920521A (zh) 基于伪本体的用户画像-项目推荐系统及方法
CN109241278A (zh) 科研知识管理方法及系统
CN107330020A (zh) 一种基于结构和属性相似度的用户实体解析方法
CN105701225A (zh) 一种基于统一关联超图规约的跨媒体检索方法
CN108763328B (zh) 一种基于黄金引用算法的论文推荐方法
CN112825089A (zh) 文章推荐方法、装置、设备及存储介质
CN105701516B (zh) 一种基于属性判别的自动图像标注方法
CN104572915B (zh) 一种基于内容环境增强的用户事件相关度计算方法
CN107026755B (zh) 一种基于排序学习的服务推荐方法
CN115618128A (zh) 一种基于图注意力神经网络的协同过滤推荐系统及方法
CN112085158A (zh) 一种基于堆栈降噪自编码器的图书推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Wu Chensheng

Inventor after: Du Liping

Inventor after: Li Menghui

Inventor after: Liu Jing

Inventor after: Huang Yurong

Inventor before: Wu Chensheng

Inventor before: Du Liping

Inventor before: Li Menghui

Inventor before: Liu Jing

Inventor before: Huang Yurong

GR01 Patent grant
GR01 Patent grant