CN112883147A - 一种基于知识关联的论文引用关联指标评估方法和装置 - Google Patents

一种基于知识关联的论文引用关联指标评估方法和装置 Download PDF

Info

Publication number
CN112883147A
CN112883147A CN202110054735.2A CN202110054735A CN112883147A CN 112883147 A CN112883147 A CN 112883147A CN 202110054735 A CN202110054735 A CN 202110054735A CN 112883147 A CN112883147 A CN 112883147A
Authority
CN
China
Prior art keywords
paper
citation
cited
value
thesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110054735.2A
Other languages
English (en)
Inventor
郭伟薇
谷俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Biguan Data Technology Co ltd
Original Assignee
Shanghai Biguan Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Biguan Data Technology Co ltd filed Critical Shanghai Biguan Data Technology Co ltd
Priority to CN202110054735.2A priority Critical patent/CN112883147A/zh
Publication of CN112883147A publication Critical patent/CN112883147A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于知识关联的论文引用关联指标评估方法,具体包括以下步骤:S1、获取需要进行评估的被引论文,检索得到被引论文对应的引用论文;S2、根据引用论文的作者信息,以及被引论文的作者信息和引用信息,计算得到引用论文的引用维度值;S3、获取论文主题知识关联库,根据论文主题知识关联库计算得到被引论文与引用论文的相似度值;S4、根据引用维度值与相似度值计算得到论文引用关联指标值,论文引用关联指标值与预设阈值组进行对比得到被引论文的引用评估结果。与现有技术相比,本发明具有提高论文引用指标的真实性和有效性等优点。

Description

一种基于知识关联的论文引用关联指标评估方法和装置
技术领域
本发明涉及论文指标评估领域,尤其是涉及一种基于知识关联的论文引用关联指标评估方法和装置。
背景技术
科学研究学术论文中所引用的文献,在论文中的作用和地位是相当重要的,在论文中引用其他论文的数据或观点,是科学研究工作本身继承性的需要,也是科研成果水平展现的需要。因此,论文引用是科学研究及论文学术水平评价的必不可少的重要组成部分。
评价论文的学术价值的主要指标是论文的引用次数。目前,论文引用的主要指数是基本科学指标数据库(ESI)、谷歌学术引用次数(google)等。ESI给出的国家、机构和科学家引文排位中,采用了对每一位作者的贡献都给以统计的方法,即一篇多个作者/机构/国家合作的论文,将被统计多次,因此能很好地表现出每位学者对国家、机构的学术贡献程度,是体现国家/地区、机构国际学术声誉的重要标志。
由于论文引用次数的重要性,在引用中也出现了不良现象,比较突出的是,论文作者自己引用自己发表的论文(自引),熟悉的作者之间相互引用对方的论文(互引)。非正常的自引、互引,影响了论文引用评价的真实性;另一方面,目前论文引用次数统计中是同等对待的,没有考虑引用论文与引用论文的关联性,也对论文引用评价真实性和学术贡献评价产生一定的影响。如何判断论文引用中的自引、互引是否正常,以及如何对论文引用进行分别对待,成为目前论文学术水平评价及科学研究贡献评价亟待解决的问题。
发明内容
本发明的目的就是为了克服上述现有技术存在的论文引用指标受非正常自引和互引的影响较大、且未考虑引用论文与引用论文的关联性的缺陷而提供一种基于知识关联的论文引用关联指标评估方法和装置。
本发明的目的可以通过以下技术方案来实现:
一种基于知识关联的论文引用关联指标评估方法,具体包括以下步骤:
S1、获取需要进行评估的被引论文,检索得到被引论文对应的引用论文;
S2、根据引用论文的作者信息,以及被引论文的作者信息和引用信息,计算得到引用论文的引用维度值;
S3、获取论文主题知识关联库,根据论文主题知识关联库计算得到被引论文与引用论文的相似度值;
S4、根据所述引用维度值与相似度值计算得到论文引用关联指标值,所述论文引用关联指标值与预设阈值组进行对比得到被引论文的引用评估结果。
所述步骤S1中通过大数据技术检索得到被引论文的引用论文。
所述引用论文的类型包括自引论文、互引论文或他引论文。
进一步地,所述引用维度值的类型包括自引维度值、互引维度值或他引维度值。
进一步地,所述被引论文的作者信息与引用论文的作者信息相同时,引用论文的类型为自引论文,引用维度值具体为自引维度值;引用论文的引用信息中存在被引论文的作者信息时,引用论文的类型为互引论文,引用维度值具体为互引维度值;引用论文的引用信息中不存在被引论文的作者信息时,引用论文的类型为他引论文,引用维度值具体为他引维度值。
进一步地,所述自引维度值小于互引维度值,互引维度值小于他引维度值。
所述引用论文的数量为1个或1个以上,当存在多个引用论文时,最终与预设阈值组进行对比的为多个引用论文的论文引用关联指标值的平均值。
所述步骤3中根据所有论文的论文题目、摘要和相应学科的关键词进行构建得到所述论文主题知识关联库。
所述步骤3中通过语义相似度计算方法,计算得到被引论文与引用论文的相似度值。
进一步地,所述步骤3中计算相似度值的过程还包括对计算得到的相似度值进行归一化处理。
所述预设阈值组包括有小到大的多个阈值,形成多个阈值区间。
一种使用所述基于知识关联的论文引用关联指标评估方法的装置,包括存储器和处理器,所述方法以计算机程序的形式储存在存储器中,并由处理器执行,执行时实现以下步骤:
S1、获取需要进行评估的被引论文,检索得到被引论文对应的引用论文;
S2、根据引用论文的作者信息,以及被引论文的作者信息和引用信息,计算得到引用论文的引用维度值;
S3、获取论文主题知识关联库,根据论文主题知识关联库计算得到被引论文与引用论文的相似度值;
S4、根据所述引用维度值与相似度值计算得到论文引用关联指标值,所述论文引用关联指标值与预设阈值组进行对比得到被引论文的引用评估结果。
与现有技术相比,本发明具有以下有益效果:
本发明通过计算被引论文与引用论文的维度值,将引用论文的维度值细化为自引维度值、互引维度值或他引维度值,充分考虑了被引论文与引用论文之间的关系,同时结合被引论文与引用论文的相似度值,以此计算得到被引论文的论文引用关联指标值,根据与预设阈值组的对比情况得到被引论文的引用评估结果,提高了论文引用指标的真实性和有效性。
附图说明
图1为本发明的流程示意图;
图2为本发明引用论文的分类示意图。
附图标记:
A-被引论文;B-他引论文;C-自引论文;D-互引论文;①-被引论文与互引论文的关联指标值;②-被引论文与自引论文的关联指标值;③-被引论文与他引论文的关联指标值。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
如图1所示,一种基于知识关联的论文引用关联指标评估方法,具体包括以下步骤:
S1、获取需要进行评估的被引论文,检索得到被引论文对应的引用论文;
S2、根据引用论文的作者信息,以及被引论文的作者信息和引用信息,计算得到引用论文的引用维度值;
S3、获取论文主题知识关联库,根据论文主题知识关联库计算得到被引论文与引用论文的相似度值;
S4、根据引用维度值与相似度值计算得到论文引用关联指标值,论文引用关联指标值与预设阈值组进行对比得到被引论文的引用评估结果。
步骤S1中通过大数据技术检索得到被引论文的引用论文。
如图2所示,引用论文的类型包括自引论文、互引论文或他引论文。
引用维度值的类型包括自引维度值、互引维度值或他引维度值,本实施例中,自引维度值、互引维度值或他引维度值分别设定为0.5、0.75、1,即自引论文关联性为50%,互引论文关联性为75%,他引论文关联性为100%。
被引论文的作者信息与引用论文的作者信息相同时,引用论文的类型为自引论文,引用维度值具体为自引维度值;引用论文的引用信息中存在被引论文的作者信息时,引用论文的类型为互引论文,引用维度值具体为互引维度值;引用论文的引用信息中不存在被引论文的作者信息时,引用论文的类型为他引论文,引用维度值具体为他引维度值。
自引维度值小于互引维度值,互引维度值小于他引维度值。
引用论文的数量为1个或1个以上,当存在多个引用论文时,最终与预设阈值组进行对比的为多个引用论文的论文引用关联指标值的平均值。
步骤3中根据所有论文的论文题目、摘要和相应学科的关键词进行构建得到论文主题知识关联库。
步骤3中通过语义相似度计算方法,计算得到被引论文与引用论文的相似度值。
步骤3中计算相似度值的过程还包括对计算得到的相似度值进行归一化处理,本实施例中,归一化后的相似度值的范围为0~1。
本实施例中,论文引用关联指标值的计算方式是引用维度值与相似度值相乘,若引用论文属于他引论文且相似度值为1时,论文引用关联指标值为1,表明被引论文的引用的真实性和有效性最强;若引用论文属于自引论文且相似度为0.5时,则论文引用关联指标值为0.25,表明被引论文的引用的真实性和有效性较弱。
预设阈值组包括有小到大的多个阈值,形成多个阈值区间,本实施例中,阈值区间包括0~0.25、0.25~0.5、0.5~0.75和0.75~1,分别对应引用有效性较弱、引用有效性中等、引用有效性较强和引用有效性最强。
一种使用基于知识关联的论文引用关联指标评估方法的装置,包括存储器和处理器,方法以计算机程序的形式储存在存储器中,并由处理器执行,执行时实现以下步骤:
S1、获取需要进行评估的被引论文,检索得到被引论文对应的引用论文;
S2、根据引用论文的作者信息,以及被引论文的作者信息和引用信息,计算得到引用论文的引用维度值;
S3、获取论文主题知识关联库,根据论文主题知识关联库计算得到被引论文与引用论文的相似度值;
S4、根据引用维度值与相似度值计算得到论文引用关联指标值,论文引用关联指标值与预设阈值组进行对比得到被引论文的引用评估结果。
此外,需要说明的是,本说明书中所描述的具体实施例,所取名称可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.一种基于知识关联的论文引用关联指标评估方法,其特征在于,具体包括以下步骤:
S1、获取需要进行评估的被引论文,检索得到被引论文对应的引用论文;
S2、根据引用论文的作者信息,以及被引论文的作者信息和引用信息,计算得到引用论文的引用维度值;
S3、获取论文主题知识关联库,根据论文主题知识关联库计算得到被引论文与引用论文的相似度值;
S4、根据所述引用维度值与相似度值计算得到论文引用关联指标值,所述论文引用关联指标值与预设阈值组进行对比得到被引论文的引用评估结果。
2.根据权利要求1所述的一种基于知识关联的论文引用关联指标评估方法,其特征在于,所述步骤S1中通过大数据技术检索得到被引论文对应的引用论文。
3.根据权利要求1所述的一种基于知识关联的论文引用关联指标评估方法,其特征在于,所述引用论文的类型包括自引论文、互引论文或他引论文,所述引用维度值的类型包括自引维度值、互引维度值或他引维度值。
4.根据权利要求3所述的一种基于知识关联的论文引用关联指标评估方法,其特征在于,所述被引论文的作者信息与引用论文的作者信息相同时,引用维度值具体为自引维度值;被引论文的引用信息中存在引用论文的作者信息时,引用维度值具体为互引维度值;被引论文的引用信息中不存在引用论文的作者信息时,引用维度值具体为他引维度值。
5.根据权利要求1所述的一种基于知识关联的论文引用关联指标评估方法,其特征在于,所述引用论文的数量为1个或1个以上,当存在多个引用论文时,步骤S4中与预设阈值组进行对比的为多个引用论文的论文引用关联指标值的平均值。
6.根据权利要求1所述的一种基于知识关联的论文引用关联指标评估方法,其特征在于,所述步骤3中根据所有论文的论文题目、摘要和相应学科的关键词进行构建得到所述论文主题知识关联库。
7.根据权利要求1所述的一种基于知识关联的论文引用关联指标评估方法,其特征在于,所述步骤3中通过语义相似度计算方法,计算得到被引论文与引用论文的相似度值。
8.根据权利要求7所述的一种基于知识关联的论文引用关联指标评估方法,其特征在于,所述步骤3中计算相似度值的过程还包括对计算得到的相似度值进行归一化处理。
9.根据权利要求1所述的一种基于知识关联的论文引用关联指标评估方法,其特征在于,所述预设阈值组包括有小到大的多个阈值,形成多个阈值区间。
10.一种使用如权利要求1所述的基于知识关联的论文引用关联指标评估方法的装置,其特征在于,包括存储器和处理器,所述方法以计算机程序的形式储存在存储器中,并由处理器执行,执行时实现以下步骤:
S1、获取需要进行评估的被引论文,检索得到被引论文对应的引用论文;
S2、根据引用论文的作者信息,以及被引论文的作者信息和引用信息,计算得到引用论文的引用维度值;
S3、获取论文主题知识关联库,根据论文主题知识关联库计算得到被引论文与引用论文的相似度值;
S4、根据所述引用维度值与相似度值计算得到论文引用关联指标值,所述论文引用关联指标值与预设阈值组进行对比得到被引论文的引用评估结果。
CN202110054735.2A 2021-01-15 2021-01-15 一种基于知识关联的论文引用关联指标评估方法和装置 Pending CN112883147A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110054735.2A CN112883147A (zh) 2021-01-15 2021-01-15 一种基于知识关联的论文引用关联指标评估方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110054735.2A CN112883147A (zh) 2021-01-15 2021-01-15 一种基于知识关联的论文引用关联指标评估方法和装置

Publications (1)

Publication Number Publication Date
CN112883147A true CN112883147A (zh) 2021-06-01

Family

ID=76048147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110054735.2A Pending CN112883147A (zh) 2021-01-15 2021-01-15 一种基于知识关联的论文引用关联指标评估方法和装置

Country Status (1)

Country Link
CN (1) CN112883147A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117972119A (zh) * 2024-04-01 2024-05-03 北京仁和汇智信息技术有限公司 一种期刊计量的方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484839A (zh) * 2016-10-08 2017-03-08 大连理工大学 一种基于学术大数据的期刊影响力评估方法
CN107391659A (zh) * 2017-07-18 2017-11-24 北京工业大学 一种基于信誉度的引文网络学术影响力评价排序方法
CN109063023A (zh) * 2018-07-13 2018-12-21 北京市科学技术情报研究所 一种基于论文引用关系的黄金引用作者发现方法
CN110851659A (zh) * 2019-10-23 2020-02-28 清华大学 基于学者论文关系网络的学者学术影响力计算方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484839A (zh) * 2016-10-08 2017-03-08 大连理工大学 一种基于学术大数据的期刊影响力评估方法
CN107391659A (zh) * 2017-07-18 2017-11-24 北京工业大学 一种基于信誉度的引文网络学术影响力评价排序方法
CN109063023A (zh) * 2018-07-13 2018-12-21 北京市科学技术情报研究所 一种基于论文引用关系的黄金引用作者发现方法
CN110851659A (zh) * 2019-10-23 2020-02-28 清华大学 基于学者论文关系网络的学者学术影响力计算方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鞠秀芳: ""基于文本相似度分析的期刊引文有效性识别研究"", 《现代情报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117972119A (zh) * 2024-04-01 2024-05-03 北京仁和汇智信息技术有限公司 一种期刊计量的方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Schäfer et al. Building large corpora from the web using a new efficient tool chain.
WO2019214245A1 (zh) 一种信息推送方法、装置、终端设备及存储介质
Qayyum et al. Identification of important citations by exploiting research articles’ metadata and cue-terms from content
TWI643076B (zh) 金融非結構化文本分析系統及其方法
US20220147023A1 (en) Method and device for identifying industry classification of enterprise and particular pollutants of enterprise
CN105740353A (zh) 个股和文章关联度的计算方法及其系统
CN110737821B (zh) 相似事件查询的方法、装置、存储介质和终端设备
Alassi et al. Effectiveness of template detection on noise reduction and websites summarization
Zhang et al. The use of dependency relation graph to enhance the term weighting in question retrieval
Pratiwi et al. Implementation of rumor detection on twitter using the svm classification method
CN113722478A (zh) 多维度特征融合相似事件计算方法、系统及电子设备
Yao et al. Context variance evaluation of pretrained language models for prompt-based biomedical knowledge probing
CN112883147A (zh) 一种基于知识关联的论文引用关联指标评估方法和装置
Guha Related Fact Checks: a tool for combating fake news
Qu et al. Discovering correlations between sparse features in distant supervision for relation extraction
Liang et al. Detecting novel business blogs
Lioma et al. A study of factuality, objectivity and relevance: three desiderata in large-scale information retrieval?
Lee et al. Detecting and visualizing online dispute dynamics in replying comments
Wolyn et al. Summarization assessment methodology for multiple corpora using queries and classification for functional evaluation
CN113988878B (zh) 一种基于图数据库技术的反欺诈方法及系统
CN116108847A (zh) 知识图谱构建方法、cwe社区描述方法以及存储介质
Montoya et al. Information retrieval on documents methodology based on entropy filtering methodologies
Zhang Learning with partial data for semantic table interpretation
CN112597287A (zh) 一种语句处理方法、语句处理装置及智能设备
Yin et al. Query-focused multi-document summarization based on query-sensitive feature space

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 200062 room 223a, 358 building, 3663 Zhongshan North Road, Putuo District, Shanghai

Applicant after: Boguan innovation (Shanghai) big data Technology Co.,Ltd.

Address before: 200062 room 223a, 358 building, 3663 Zhongshan North Road, Putuo District, Shanghai

Applicant before: Shanghai biguan Data Technology Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 200433 room 403-3, No. 2 (Building B), Lane 2005, Huangxing Road, Yangpu District, Shanghai

Applicant after: Boguan innovation (Shanghai) big data Technology Co.,Ltd.

Address before: 200062 room 223a, 358 building, 3663 Zhongshan North Road, Putuo District, Shanghai

Applicant before: Boguan innovation (Shanghai) big data Technology Co.,Ltd.

CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Gu Jun

Inventor after: Li Yongzhi

Inventor after: Jiang Ming

Inventor after: Guo Weiwei

Inventor before: Guo Weiwei

Inventor before: Gu Jun

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210601