CN108763328B - 一种基于黄金引用算法的论文推荐方法 - Google Patents
一种基于黄金引用算法的论文推荐方法 Download PDFInfo
- Publication number
- CN108763328B CN108763328B CN201810432225.2A CN201810432225A CN108763328B CN 108763328 B CN108763328 B CN 108763328B CN 201810432225 A CN201810432225 A CN 201810432225A CN 108763328 B CN108763328 B CN 108763328B
- Authority
- CN
- China
- Prior art keywords
- paper
- group
- equal
- paper group
- revision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于黄金引用算法的论文推荐方法,包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;然后,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;最后,迭代的缩小自引修订论文群体的范围,直至结果收敛,得出黄金引用论文。通过标定论文的引用属性,排除论文引用关系中自引的干扰,再依据自引修订引用次数,递归地缩小论文群体,排除低质低效他引论文的干扰,使得用户快速、准确的检索到高质量论文。
Description
技术领域
本发明属于大数据论文检索推荐技术领域,具体地说涉及一种基于黄金引用算法的论文推荐方法。
背景技术
基于推荐信息的不同,论文推荐主要分为基于内容的推荐,基于协同过滤的推荐,社会化推荐和混合模型推荐。在论文的推荐系统当中,还存在着一种特殊的基于引用的推荐,但从数量庞大、良莠不齐的文献资料中获取具有较高质量的科技论文是一项非常困难的工作,如何有效的自动评估科技论文质量成为了研究课题。被引次数是一项客观且直观的衡量论文质量的指标,论文引用包括作者在后来的论文中自我引用和他人的引用两种,自引次数的多少与论文的质量评估关系不大,而在统计引用次数时并不对二者做出区分,这是利用引用次数对科技论文进行评价时的一个局限性。同时,各个论文的诸多施引论文不能认为具有同等的质量或影响力,使得论文的被引次数无法完全体现论文质量。
现有技术中,基于论文引用次数提出了h指数、g指数,用于评估研究人员的学术产出数量与学术产出水平,但其排序的基础数据并没有进行处理,在实际应用中不能准确地反映真实情况。被引频次标准化虽然消除学科领域、文献类型、出版时间等因素的影响,实现跨学科或跨领域的比较,但统计数据庞大且计算繁琐,科研工作者或文献研究工作者无法快速识别某一领域或学科的关键论文群。
现有技术公开了一种基于引用关系分布式表达的论文推荐方法,利用分布式向量来表达论文在权重引用网络当中的上下文,然后利用该向量计算论文之间的相似度,达到论文推荐的目的。该申请只考虑了论文之间引用的相似度或论文内容的相似度,但并不能完全体现论文的质量。
有鉴于此特提出本发明。
发明内容
本发明要解决的技术问题在于克服现有技术的不足,提供一种基于黄金引用算法的论文推荐方法,通过黄金引用算法排除自引论文和低质低效的他引论文的干扰,使得用户可快速、准确的检索到高质量论文。
为解决上述技术问题,本发明采用技术方案的基本构思是:一种基于黄金引用算法的论文推荐方法,包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;然后,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;最后,递归的缩小自引修订论文群体的范围,直至结果收敛,得出黄金引用论文。本申请中的黄金引用算法模型,排除了引用次数中的自引,从而避免了自引在论文评价中的干扰,又通过迭代删除的方式排除了引用次数统计中低质低效的他引干扰,提高了对高质量论文识别的准确性,并且该算法简单易于实行,用户运用该算法对论文群体中的高质量论文进行统计、计算较为方便。
进一步,所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文与论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系。
进一步,引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;
在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为其中,
进一步,所述标定论文引用属性,步骤如下:根据论文作者判定论文的引用关系是自引还是他引,若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引。
进一步,依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1;其中,i≥1,j≥1。
进一步,论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1。
进一步,依据自引修订引用次数为生成自引修订论文群体G',从而构建出自引修订网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络。
进一步,引入被引次数设定值k,k依次由小到大取值,采用迭代删除的方式逐层缩小论文群体的范围,直至结果收敛,其中,k为整数,且k≥0。
进一步,第k层的初始论文群体为Gk时,Gk中含有|Vk|=Nk个节点,即含有Nk篇论文,|Ek|=Mk条边,第i篇论文在论文群体Gk中的被引次数关系式为
采用迭代的方式缩小Gk的范围,删除Gk中被引次数等于k的论文及其引用关系,生成论文群体Gk,1,第i篇论文在论文群体Gk,1中的被引次数关系式为继续删除Gk,1中小于和/或等于k的论文及其引用关系,并生成论文群体Gk,2,继续迭代删除,直至生成论文群体Gk,q,且Gk,q中论文被至少k+1篇Gk,q论文引用,形成第k+1层的初始论文群体,即Gk,q记作Gk+1;
每层迭代删除的论文组成论文群体Dk,删除后的论文群体Gk+1中含有|Vk+1|=Nk+1个节点,即含有Nk+1篇论文,|Ek+1|=Mk+1条边,第i篇论文在论文群体Gk+1中的被引次数关系式为且被引次数大于k,其中,k、q为整数,且k≥0,q≥1。
进一步,以自引修订论文群体G'为初始论文群体,G0=G',采用迭代删除的方式逐层缩小论文群体的范围,当k大于和/或等于n时,终止删除论文节点,论文群体收敛,得出黄金引用论文,其中n为整数,且n≥0,具体包括以下步骤:
S11.k=0,删除G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续删除G0,1中等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代删除,直至生成论文群体G0 ,q,且G0,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代删除的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为其中,q为整数,且q≥1;
S12.k=1,删除论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续删除G1,1中小于和/或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代删除,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代删除的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;
S13.k=2,删除G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续删除G2,1中小于和/或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代删除,直至生成论文群体G2,q,且G2,q中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代删除的论文组成论文群体为D2,论文群体缩小为G3,含有论文数量为|V3|=N3篇,第i篇论文在论文群体G3中的被引次数关系式为其中,q为整数,且q≥1;
S14.依照步骤S11-S13,继续迭代删除边缘性论文,当k=n时,删除Gn中自引修订引用次数等于n的论文及其引用关系,生成论文群体Gn,1,第i篇论文在论文群体Gn,1中的被引次数关系式为继续删除Gn,1中小于和/或等于n的论文及其引用关系,并生成论文群体Gn,2,继续迭代删除,直至生成论文群体Gn,q,且Gn,q中论文被其他至少n+1篇Gn,q中的论文引用,其中Gn,q记作Gn+1,迭代删除的论文组成论文群体为Dn,论文群体缩小为Gn+1,则结果收敛,Gn+1含有论文数量为|Vn+1|=Nn+1篇为黄金引用论文,其中n,q为整数,且n≥0,q≥1;
优选的,Nn-1-Nn小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,其中n为整数,且n≥0;
优选的,Nn小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,其中n为整数,且n≥0;
优选的,小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,其中n为整数,且n≥0。
论文的原始引用次数统计是将每次被引用记录均记为1,通过论文作者对引用关系进一步地限定,排除论文引用关系中自引的干扰,再根据施引论文的被引情况修订论文的引用次数,排除低质低效他引论文的干扰,采用迭代方式逐层地缩小了论文群体范围,使得用户快速、准确的检索到高质量论文;从而使得采用对论文引用次数评估获得高质量论文的方法更加合理。
采用上述技术方案后,本发明与现有技术相比具有以下有益效果:
1、通过构建论文群体初始引用网络模型,基于论文引用次数识别高质量论文,使得论文群中论文相互之间的引用关系更加具体直观,且计算过程快速便捷,选出的论文群体具有较高的权威性。
2、实施自引修订引用次数,排除了引用次数中的自引用论文,克服了自引在论文评价中的干扰,使得评估出的论文质量更加合理;同时,采用迭代删除的方式,排除自引修订引用次数统计中低质低效的他引干扰;综合考虑作者自引和低质量论文引用的干扰因素,对论文的初始的引用次数进行统计修订,提高推荐系统识别高质量论文的准确性。
下面结合附图对本发明的具体实施方式作进一步详细的描述。
附图说明
附图作为本发明的一部分,用来提供对本发明的进一步的理解,本发明的示意性实施例及其说明用于解释本发明,但不构成对本发明的不当限定。显然,下面描述中的附图仅仅是一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。在附图中:
图1是本发明中一种黄金引用论文算法的流程示意图;
图2是本发明中一种应用黄金引用论文算法的流程示意图;
图3是本发明中论文群体初始引用网络模型示意图;
图4是本发明中递归删除边缘性论文的数量统计示意图。
需要说明的是,这些附图和文字描述并不旨在以任何方式限制本发明的构思范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
如图1至图4所示,本发明介绍了一种基于黄金引用算法的论文推荐方法,首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;然后,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;最后,递归的缩小自引修订论文群体的范围,直至结果收敛,得出黄金引用论文。
如图1所示,本实施例中,具体包括以下步骤:
S1.在论文数据库中选定论文群体范围;
S2.构建选定论文群体的初始引用网络模型;
如图3所示,构建论文引用网络,论文群体G=(V,E)是由|V|=N个顶点和|E|=M条边所组成的一个有向网络,其中,G代表论文群体中论文与论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系;
引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;
在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为
S3.标定引用属性,建立自引修订引用网络;
首先,根据论文的作者判断论文之间的引用关系是自引还是他引;若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引;
其次,依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1;其中,i≥1,j≥1;在Ei中引入自引系数λi,j,删除初始引用网络模型中第i篇论文的自引引用关系,获得第i篇论文在论文群体中的他引引用关系;
最后,论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1;依据自引修订引用次数生成自引修订论文群体G',从而构建出自引修订网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络
如图4所示,引入被引次数设定值k,k依次由小到大取值,采用迭代删除的方式逐层缩小论文群体的范围,直至结果收敛,其中,k为整数,且k≥0。
S4.以自引修订论文群体G'为初始论文群体,G0=G',采用迭代删除的方式逐层缩小论文群体的范围,当k大于和/或等于n时,终止删除论文节点,论文群体收敛,得出黄金引用论文,其中n为整数,且n≥0,
如图2所示,具体步骤如下:
S11.k=0,删除G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续删除G0,1中等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代删除,直至生成论文群体G0 ,q,且G0,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代删除的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为其中,q为整数,且q≥1;
S12.k=1,删除论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续删除G1,1中小于和/或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代删除,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代删除的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文
在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;
S13.k=2,删除G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续删除G2,1中小于和/或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代删除,直至生成论文群体G2,q,且G2,q中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代删除的论文组成论文群体为D2,论文群体缩小为G3,含有论文数量为|V3|=N3篇,第i篇论文在论文群体G3中的被引次数关系式为其中,q为整数,且q≥1;
S14.依照步骤S11-S13,继续迭代删除边缘性论文,当k=n时,删除Gn中自引修订引用次数等于n的论文及其引用关系,生成论文群体Gn,1,第i篇论文在论文群体Gn,1中的被引次数关系式为继续删除Gn,1中小于和/或等于n的论文及其引用关系,并生成论文群体Gn,2,继续迭代删除,直至生成论文群体Gn,q,且Gn,q中论文被其他至少n+1篇Gn,q中的论文引用,论文群体收敛,其中Gn,q记作Gn+1,迭代删除的论文组成论文群体为Dn,论文群体缩小为Gn+1,Gn+1含有论文数量为|Vn+1|=Nn+1篇为黄金引用论文,其中n,q为整数,且n≥0,q≥1;
优选的,依照步骤S11-S13,k继续依次由小到大取值,Nn-1-Nn小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,Gn含有论文数量为|Vn|=Nn篇为黄金引用论文,其中n为整数,且n≥0;。
优选的,依照步骤S11-S13,k继续依次由小到大取值,Nn小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,Gn含有论文数量为|Vn|=Nn篇为黄金引用论文,其中n为整数,且n≥0;
优选的,依照步骤S11-S13,k继续依次由小到大取值,小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,Gn含有论文数量为|Vn|=Nn篇为黄金引用论文,其中n为整数,且n≥0。
S5.输出黄金引用论文。
本实施例中,步骤S1中论文群体可以是按照主题、领域、学科和/或年代划定范围,也可以是按照设定的检索策略划定范围,也可以是数据库中的全部论文。
本实施例中,以主题为马克思的论文群体为例,首先选定论文群体主题为马克思的论文,含有论文17260篇;依据自引修订引用次数删除初始引用网络模型中的自引用关系;然后迭代的删除论文群体中的边缘性论文,即排除低质低效他引论文;最后收敛结果获得163篇黄金引用论文推荐给用户。
本实施例中,以主题为航空航天的论文群体为例,首先选定论文群体主题为航空航天的论文,含有论文20781篇;依据自引修订引用次数删除初始引用网络模型中的自引用关系;然后迭代的删除论文群体中的边缘性论文,即排除低质低效他引论文;最后收敛结果获得461篇黄金引用论文推荐给用户。
实施例一
本发明实施例中介绍了一种基于黄金引用算法的论文排序方法,包括以下步骤:首先,在论文数据库中选定论文群体范围;
其次,利用选定论文群体中论文的相互引用关系构建初始引用网络模型;
然后,标定初始引用网络模型中论文的引用属性,并引入论文的自引系数修订引用次数,生成自引修订论文群体;
最后,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,并进行降序排列。
本实施例中,论文群体可以是按照主题、领域、学科和/或年代划定范围,或者是按照设定的检索策略划定范围,或者是数据库中的全部论文;
本实施例中,所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文以及论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系。
本实施例中,引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;
在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为其中,
本实施例中,标定论文引用属性,步骤如下:根据论文的作者判断论文之间的引用关系是自引还是他引;若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引;
依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1,其中,i≥1,j≥1;在Ei中引入自引系数λi,j,删除初始引用网络模型中第i篇论文的自引引用关系,获得第i篇论文在论文群体中的他引引用关系。
本实施例中,论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1。
本实施例中,依据自引修订引用次数为生成自引修订论文群体G',从而构建出自引用网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络。
本实施例中,引入被引次数设定值k,k依次由小到大取值,采用迭代筛选的方式逐层缩小论文群体的范围,将每层筛选出的论文组成论文群体,并进行排序,直至输出全部的排序结果,其中,k为整数,且k≥0。
本实施例中,第k层的初始论文群体为Gk时,Gk中含有|Vk|=Nk个节点,即含有Nk篇论文,|Ek|=Mk条边,第i篇论文在论文群体Gk中的被引次数关系式为
采用迭代筛选的的方式缩小Gk的范围,筛选出Gk中被引次数等于k的论文及其引用关系,生成论文群体Gk,1,第i篇论文在论文群体Gk,1中的被引次数关系式为继续筛选出Gk,1中小于和/或等于k的论文及其引用关系,并生成论文群体Gk,2,继续迭代筛选,直至生成论文群体Gk,q,且Gk,q中论文被至少k+1篇Gk,q中的论文引用,形成第k+1层的初始论文群体,即Gk,q记作Gk+1;
每层迭代筛选出的论文组成论文群体Dk,筛选后的论文群体Gk+1中含有|Vk+1|=Nk+1个节点,即含有Nk+1篇论文,|Ek+1|=Mk+1条边,第i篇论文在论文群体Gk+1中的被引次数关系式为且被引次数大于k,其中,k、q为整数,且k≥0,q≥1。
本实施例中,以自引修订论文群体G'为初始论文群体,每层迭代删除的论文组成论文群体,并进行降序排列,直至输出全部的排序结果,具体步骤如下所示:
S11.k=0,筛选出G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续筛选出G0,1中等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代筛选,直至生成论文群体G0,q 且G0,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代筛选出的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为其中,q为整数,且q≥1;
S32.k=1,筛选出论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续筛选出G1,1中小于和/或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代筛选,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代筛选出的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;
S33.k=2,筛选出G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续筛选出G2,1中小于和/或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代筛选,直至生成论文群体G2,q,且G2,q中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代筛选出的论文组成论文群体为D2,论文群体缩小为G3,含有论文数量为|V3|=N3篇,第i篇论文在论文群体G3中的被引次数关系式为其中,q为整数,且q≥1;
S34.依照步骤S11-S13,继续迭代筛选边缘性论文,为k=n时,筛选出Gn中自引修订引用次数等于n的论文及其引用关系,生成论文群体Gn,1,第i篇论文在论文群体Gn,1中的被引次数关系式为继续筛选出Gn,1中小于和/或等于n的论文及其引用关系,并生成论文群体Gn,2,继续迭代筛选,直至生成论文群体Gn,q,且Gn,q中论文被其他至少n+1篇Gn,q中的论文引用,其中Gn,q记作Gn+1,迭代筛选出的论文组成论文群体为Dn,论文群体缩小为Gn+1,Gn+1含有论文数量为|Vn+1|=Nn+1篇论文,其中n,q为整数,且n≥0,q≥1;
S35.当Nn+1=0时,终止筛选论文节点,输出论文群体排序结果,其中排序结果为:{Dn、Dn-1……D2、D1、D0};
本实施例中,k依次由小到大取值,k大于和/或等于某一设定值的论文群体进行迭代筛选出的论文为黄金引用论文,则从排序结果中由高到低依次输出论文群体,其中k为正整数,且k≥0;
优选的,小于和/或等于某一设定值时的论文群体进行迭代筛选出的论文为黄金引用论文,并将论文群体从排序结果中由高到低输出,n为整数,且n≥0;
优选的,Nn-1-Nn小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为黄金引用论文,并将论文群体从排序结果中由高到低输出,n为整数,且n≥0;
优选的,Nn小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为黄金引用论文,并将论文群体从排序结果中由高到低输出,n为整数,且n≥0。
本实施例中,用户手动按序查看,获取高质量的黄金引用论文。
论文的原始引用次数统计是将每次被引用记录均记为1,通过论文的作者对论文间的引用关系进一步地限定,排除论文引用关系中自引的干扰,再根据施引论文的被引情况修订论文的引用次数,排除低质低效他引论文的干扰,以自引修订论文群体G'为初始论文群体,依据自引修订引用次数,采用迭代筛选的方式逐层对论文群体筛选,筛选出的论文群体组合成论文群体,并进行降序排列,增加了用户的论文选择范围,提升用户体验。
以上所述仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专利的技术人员在不脱离本发明技术方案范围内,当可利用上述提示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明方案的范围内。
Claims (5)
1.一种基于黄金引用算法的论文推荐方法,其特征在于:包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;然后,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;最后,迭代的缩小自引修订论文群体的范围,直至结果收敛,得出黄金引用论文;
所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文以及论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系;
引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;
在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为
所述标定论文引用属性,步骤如下:根据论文作者判定论文的引用关系是自引还是他引,若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引;
依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1;其中,i≥1,j≥1;
论文vi被论文vj引用且为自引,则引用系数ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1;
依据自引修订引用次数为生成自引修订论文群体G',从而构建出自引修订网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络;
引入被引次数设定值k,k依次由小到大取值,采用迭代删除的方式逐层缩小论文群体的范围,直至结果收敛,其中,k为整数,且k≥0;
第k层的初始论文群体为Gk时,Gk中含有|Vk|=Nk个节点,即含有Nk篇论文,|Ek|=Mk条边,第i篇论文在论文群体Gk中的被引次数关系式为
采用迭代的方式缩小Gk的范围,删除Gk中被引次数等于k的论文及其引用关系,生成论文群体Gk,1,第i篇论文在论文群体Gk,1中的被引次数关系式为继续删除Gk,1中小于和/或等于k的论文及其引用关系,并生成论文群体Gk,2,继续迭代删除,直至生成论文群体Gk,q,且Gk,q中论文被至少k+1篇Gk,q中的论文引用,形成第k+1层的初始论文群体,即Gk,q记作Gk+1;
每层迭代删除的论文组成论文群体Dk,删除后的论文群体Gk+1中含有|Vk+1|=Nk+1个节点,即含有Nk+1篇论文,|Ek+1|=Mk+1条边,第i篇论文在论文群体Gk+1中的被引次数关系式为且被引次数大于k,其中,k、q为整数,且k≥0,q≥1。
2.根据权利要求1所述的一种基于黄金引用算法的论文推荐方法,其特征在于:
以自引修订论文群体G'为初始论文群体,G0=G',采用迭代删除的方式逐层缩小论文群体的范围,当k大于和/或等于n时,终止删除论文节点,论文群体收敛,得出黄金引用论文,其中n为整数,且n≥0,具体包括以下步骤:
S11.k=0,删除G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0 ,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续删除G0,1中等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代删除,直至生成论文群体G0,q,且G0 ,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代删除的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为其中,q为整数,且q≥1;
S12.k=1,删除论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续删除G1,1中小于或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代删除,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代删除的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;
S13.k=2,删除G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2 ,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续删除G2,1中小于或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代删除,直至生成论文群体G2 ,q,且G2,q中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代删除的论文组成论文群体为D2,论文群体缩小为G3,含有论文数量为|V3|=N3篇,第i篇论文在论文群体G3中的被引次数关系式为其中,q为整数,且q≥1;
S14.依照步骤S11-S13,继续迭代删除边缘性论文,当k=n时,删除Gn中自引修订引用次数等于n的论文及其引用关系,生成论文群体Gn,1,第i篇论文在论文群体Gn,1中的被引次数关系式为继续删除Gn,1中小于或等于n的论文及其引用关系,并生成论文群体Gn,2,继续迭代删除,直至生成论文群体Gn,q,且Gn,q中论文被其他至少n+1篇Gn,q中的论文引用,其中Gn,q记作Gn+1,迭代删除的论文组成论文群体为Dn,论文群体缩小为Gn+1,Gn +1含有论文数量为|Vn+1|=Nn+1篇为黄金引用论文,其中n,q为整数,且n≥0,q≥1。
3.根据权利要求2所述的一种基于黄金引用算法的论文推荐方法,其特征在于:Nn-1-Nn小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,其中n为整数,且n≥0。
4.根据权利要求2所述的一种基于黄金引用算法的论文推荐方法,其特征在于:Nn小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,其中n为整数,且n≥0。
5.根据权利要求2所述的一种基于黄金引用算法的论文推荐方法,其特征在于:小于和/或等于某一设定值时,终止删除论文节点,论文群体收敛为Gn,其中n为整数,且n≥0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810432225.2A CN108763328B (zh) | 2018-05-08 | 2018-05-08 | 一种基于黄金引用算法的论文推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810432225.2A CN108763328B (zh) | 2018-05-08 | 2018-05-08 | 一种基于黄金引用算法的论文推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108763328A CN108763328A (zh) | 2018-11-06 |
CN108763328B true CN108763328B (zh) | 2019-05-14 |
Family
ID=64009101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810432225.2A Active CN108763328B (zh) | 2018-05-08 | 2018-05-08 | 一种基于黄金引用算法的论文推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108763328B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078859B (zh) * | 2019-11-22 | 2021-02-09 | 北京市科学技术情报研究所 | 一种基于引用次数的作者推荐方法 |
CN113158041B (zh) * | 2021-04-19 | 2022-07-29 | 电子科技大学 | 一种基于多属性特征的文章推荐方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105589948B (zh) * | 2015-12-18 | 2018-10-12 | 重庆邮电大学 | 一种文献引用网络可视化及文献推荐方法及系统 |
CN105718528B (zh) * | 2016-01-15 | 2019-06-21 | 上海交通大学 | 基于论文间引用关系的学术地图展示方法 |
CN106126732B (zh) * | 2016-07-04 | 2020-03-10 | 中南大学 | 基于兴趣相似模型的作者影响力传播能力预测方法 |
CN106844665B (zh) * | 2017-01-20 | 2020-05-08 | 中山大学 | 一种基于引用关系分布式表达的论文推荐方法 |
CN107832412B (zh) * | 2017-11-06 | 2020-06-30 | 浙江工业大学 | 一种基于文献引用关系的刊物聚类方法 |
-
2018
- 2018-05-08 CN CN201810432225.2A patent/CN108763328B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108763328A (zh) | 2018-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105069122B (zh) | 一种基于用户行为的个性化推荐方法及其推荐装置 | |
CN107885749B (zh) | 本体语义扩展与协同过滤加权融合的工艺知识检索方法 | |
CN103544216B (zh) | 一种结合图像内容和关键字的信息推荐方法及系统 | |
CN107025310A (zh) | 一种自动实时新闻推荐方法 | |
CN104063481A (zh) | 一种基于用户实时兴趣向量的电影个性化推荐方法 | |
WO2022156328A1 (zh) | 一种融合服务协作关系的Restful类型Web服务聚类方法 | |
CN105183748B (zh) | 一种基于内容和评分的组合预测方法 | |
CN108763328B (zh) | 一种基于黄金引用算法的论文推荐方法 | |
CN108334592A (zh) | 一种基于内容与协同过滤相结合的个性化推荐方法 | |
CN107329994A (zh) | 一种基于用户特征的改进协同过滤推荐方法 | |
CN105740480B (zh) | 机票推荐方法及系统 | |
CN105631018A (zh) | 基于主题模型的文章特征抽取方法 | |
CN109002524B (zh) | 一种基于论文引用关系的黄金引用作者排序方法 | |
CN109241278A (zh) | 科研知识管理方法及系统 | |
CN104809252A (zh) | 互联网数据提取系统 | |
CN105869058B (zh) | 一种多层潜变量模型用户画像提取的方法 | |
Duan et al. | A hybrid intelligent service recommendation by latent semantics and explicit ratings | |
CN108363752B (zh) | 基于微博传播规模预测的用户社会影响力分析方法 | |
CN108846019B (zh) | 一种基于黄金引用算法的论文排序方法 | |
Qin et al. | Towards a personalized movie recommendation system: A deep learning approach | |
CN107730306A (zh) | 基于多维偏好模型的电影评分预测与偏好估计方法 | |
Yang | Uncertainty prediction method for traffic flow based on K-nearest neighbor algorithm | |
Shuxian et al. | Design and implementation of movie recommendation system based on naive bayes | |
CN107315807B (zh) | 人才推荐方法和装置 | |
CN115905695A (zh) | 一种结合Doc2vec和Faiss的个性化文献推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Wu Chensheng Inventor after: Du Liping Inventor after: Li Menghui Inventor after: Liu Jing Inventor after: Huang Yurong Inventor before: Wu Chensheng Inventor before: Du Liping Inventor before: Li Menghui Inventor before: Liu Jing Inventor before: Huang Yurong |
|
GR01 | Patent grant | ||
GR01 | Patent grant |