CN110189051A - 一种考虑引用异常值的期刊学术影响力的评估方法 - Google Patents

一种考虑引用异常值的期刊学术影响力的评估方法 Download PDF

Info

Publication number
CN110189051A
CN110189051A CN201910491100.1A CN201910491100A CN110189051A CN 110189051 A CN110189051 A CN 110189051A CN 201910491100 A CN201910491100 A CN 201910491100A CN 110189051 A CN110189051 A CN 110189051A
Authority
CN
China
Prior art keywords
paper
periodical
exceptional value
journals
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910491100.1A
Other languages
English (en)
Inventor
周丰丰
刘确旺
李飞
段镁钰
马天放
汪虹宇
姚曌旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BIOKNOW INFORMATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING BIOKNOW INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BIOKNOW INFORMATION TECHNOLOGY Co Ltd filed Critical BEIJING BIOKNOW INFORMATION TECHNOLOGY Co Ltd
Priority to CN201910491100.1A priority Critical patent/CN110189051A/zh
Publication of CN110189051A publication Critical patent/CN110189051A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Educational Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种考虑引用异常值的期刊学术影响力的评估方法,计算N年某期刊的学术影响力,该方法包括步骤:1)统计N‑1年和N‑2年期刊每篇论文引用量中的异常值:N‑1年期刊论文被引用数集合S1;N‑2年期刊论文被引用数集合S2;2)计算S1和S2中的异常值组成集合S3;3)从期刊中剔除在集合S3中的论文;4)计算剔除集合S3中论文后N‑1年收录论文数R1;N‑2年收录论文数R2;N年自引N‑1年论文数SC1;N年他引N‑1年论文数C1;N年自引N‑2年论文数SC2;N年他引N‑2年论文数C2;5)根据公式:计算N年期刊学术影响力,若Ki为N‑1年该期刊收录论文的引用数,则R=R1,否则R=R2。本发明将降低利用漏洞提高期刊学术影响力的风险。

Description

一种考虑引用异常值的期刊学术影响力的评估方法
技术领域
本发明属于文献评估方法领域,特别是涉及一种考虑引用异常值的期刊学术影响力的评估方法。
背景技术
影响因子(Impact Factor,IF):是汤森路透(Thomson Reuters)出品的期刊引证报告(Journal Citation Reports,JCR)中的一项数据。即某期刊前两年发表的论文在该报告年份(JCR year)中被引用总次数除以该期刊在这两年内发表的论文总数。
根据影响因子公式(以2018年IF的计算为例,M为该期刊2016年发表的文章数量,N为该期刊2017年发表的文章数量,C为该期刊2016和2017年两年发表的文章在2018年这一年被引用的总次数。)计算后的结果进行排序来评价期刊的影响力,虽然该公式目前是国际公认的标准,但是近年来的一些期刊利用公式漏洞(例如综述+减少学术文章比例+强制投稿者引用本期刊的文章)来提升自己期刊的影响力,也让该公式的权威性再次受到挑战。
PageRank:网页排名,又称网页级别,是一种根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。
领域中还有根据Google对网页重要程度提出的PageRank算法来对期刊进行排序,该算法对于网页链接网络和对于期刊引用网络的作用有一些本质区别,网页链接网络中新加入的网页节点可以指向旧网页节点,旧网页节点也可以指向新网页节点,但是期刊引用网络中已存在节点是不能指向新加入节点的,所以直接利用PageRank算法有失偏颇。
因此,如何解决上述问题成为本领域人员研究的重点。
发明内容
本发明的目的就是提供一种考虑引用异常值的期刊学术影响力的评估方法,能够弥补上述现有技术的不足之处。
本发明的目的通过下述技术方案来实现:
一种考虑引用异常值的期刊学术影响力的评估方法,计算N年一个期刊的学术影响力,N为任意年,该方法包括步骤:
1)计算机的数据检索模块和数据处理模块从期刊数据信息中统计N-1年以及N-2年该期刊每篇论文引用量集合中的异常值:
计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-1年该期刊每篇论文被引用数集合S1{m1,m2,,,mn},n为N-1年该期刊收录论文总数;
计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-2年该期刊每篇论文被引用数集合S2{q1,q2,,,qx},x为N-2年该期刊收录论文总数;
2)通过计算机数据处理模块计算S1和S2中的异常值组成集合S3{K1,K2,,,Ky},y为S1、S2的总异常值个数;
3)通过计算机数据处理模块从该期刊中剔除在集合S3中的论文;
4)通过计算机数据处理模块剔除集合S3中论文后该期刊收录论文数和引用数,包括:
N-1年收录论文数R1
N-2年收录论文数R2
N年自引N-1年论文数SC1
N年他引N-1年论文数C1
N年自引N-2年论文数SC2
N年他引N-2年论文数C2
5)通过计算机数据处理模块计算该期刊N年的学术影响力Score:
若Ki为N-1年该期刊收录论文的引用数,则R=R1,否则R=R2
作为优选,异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。
作为优选,所述N年为2018年时,则N-1年为2017年,N-2年为2016年。
与现有技术相比,本发明的有益效果在于:
本发明综合考虑自引与他引的区别;对异常值单独处理也将降低利用漏洞提高期刊学术影响力的风险。
具体实施方式
下面结合具体实施例对本发明作进一步的说明。
实施例一
一种考虑引用异常值的期刊学术影响力的评估方法,计算N年一个期刊的学术影响力,N为任意年,该方法包括步骤:
1)计算机的数据检索模块和数据处理模块从期刊数据信息中统计N-1年以及N-2年该期刊每篇论文引用量集合中的异常值:
计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-1年该期刊每篇论文被引用数集合S1{m1,m2,,,mn},n为N-1年该期刊收录论文总数;
计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-2年该期刊每篇论文被引用数集合S2{q1,q2,,,qx},x为N-2年该期刊收录论文总数;其中数据检索模块为基于大数据的信息检索系统,数据处理模块为计算机的处理器,通过互联网检索期刊的数据信息,再利用计算机的处理器,将需要信息组成集合。
2)通过计算机数据处理模块计算S1和S2中的异常值组成集合S3{K1,K2,,,Ky},y为S1、S2的总异常值个数,异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值;
3)通过计算机数据处理模块从该期刊中剔除在集合S3中的论文;
4)通过计算机数据处理模块剔除集合S3中论文后该期刊收录论文数和引用数,包括:
N-1年收录论文数R1
N-2年收录论文数R2
N年自引N-1年论文数SC1
N年他引N-1年论文数C1
N年自引N-2年论文数SC2
N年他引N-2年论文数C2
“自引”和“他引”的定义为:论文引用自己所投期刊的文章叫做“自引”;其他期刊论文引用该期刊论文叫做“他引”。
5)通过计算机数据处理模块计算该期刊N年的学术影响力Score:
若Ki为N-1年该期刊收录论文的引用数,则R=R1,否则R=R2
其中的N年可以为任意一年,例如:N为2018年的时候,则N-1年则为2017年,N-2年则为2016年。
其中各个公式是由计算机建立的运算模型,通过输入相关期刊的信息,计算机就能够获取其公式模型所需的数据,然后通过公式模型最终运算得出结果。
本实施例中,综合考虑自引与他引的区别;对异常值单独处理也将降低利用漏洞提高期刊学术影响力的风险。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种考虑引用异常值的期刊学术影响力的评估方法,计算N年一个期刊的学术影响力,N为任意年,其特征在于:该方法包括步骤:
1)计算机的数据检索模块和数据处理模块从期刊数据信息中统计N-1年以及N-2年该期刊每篇论文引用量集合中的异常值:
计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-1年该期刊每篇论文被引用数集合S1{m1,m2,,,mn},n为N-1年该期刊收录论文总数;
计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-2年该期刊每篇论文被引用数集合S2{q1,q2,,,qx},x为N-2年该期刊收录论文总数;
2)通过计算机数据处理模块计算S1和S2中的异常值组成集合S3{K1,K2,,,Ky},y为S1、S2的总异常值个数;
3)通过计算机数据处理模块从该期刊中剔除在集合S3中的论文;
4)通过计算机数据处理模块剔除集合S3中论文后该期刊收录论文数和引用数,包括:
N-1年收录论文数R1
N-2年收录论文数R2
N年自引N-1年论文数SC1
N年他引N-1年论文数C1
N年自引N-2年论文数SC2
N年他引N-2年论文数C2
5)通过计算机数据处理模块计算该期刊N年的学术影响力Score:
若Ki为N-1年该期刊收录论文的引用数,则R=R1,否则R=R2
2.根据权利要求1所述的一种考虑引用异常值的期刊学术影响力的评估方法,其特征在于:异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。
3.根据权利要求1所述的一种考虑引用异常值的期刊学术影响力的评估方法,其特征在于:所述N年为2018年时,则N-1年为2017年,N-2年为2016年。
CN201910491100.1A 2019-06-06 2019-06-06 一种考虑引用异常值的期刊学术影响力的评估方法 Pending CN110189051A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910491100.1A CN110189051A (zh) 2019-06-06 2019-06-06 一种考虑引用异常值的期刊学术影响力的评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910491100.1A CN110189051A (zh) 2019-06-06 2019-06-06 一种考虑引用异常值的期刊学术影响力的评估方法

Publications (1)

Publication Number Publication Date
CN110189051A true CN110189051A (zh) 2019-08-30

Family

ID=67720656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910491100.1A Pending CN110189051A (zh) 2019-06-06 2019-06-06 一种考虑引用异常值的期刊学术影响力的评估方法

Country Status (1)

Country Link
CN (1) CN110189051A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115307644A (zh) * 2022-08-25 2022-11-08 西南石油大学 一种基于uwb的三维定位模型

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080106886A (ko) * 2008-11-11 2008-12-09 김엽 상품 무료 구매 기회 제공을 위한 온라인 쇼핑몰운영시스템 및 그 방법
CN106446570A (zh) * 2016-10-08 2017-02-22 大连理工大学 一种基于学术大数据的会议影响力评估方法
CN108132961A (zh) * 2017-11-06 2018-06-08 浙江工业大学 一种基于引用预测的参考文献推荐方法
CN108764546A (zh) * 2018-05-17 2018-11-06 鞍山师范学院 一种基于学术大数据的论文影响力预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080106886A (ko) * 2008-11-11 2008-12-09 김엽 상품 무료 구매 기회 제공을 위한 온라인 쇼핑몰운영시스템 및 그 방법
CN106446570A (zh) * 2016-10-08 2017-02-22 大连理工大学 一种基于学术大数据的会议影响力评估方法
CN108132961A (zh) * 2017-11-06 2018-06-08 浙江工业大学 一种基于引用预测的参考文献推荐方法
CN108764546A (zh) * 2018-05-17 2018-11-06 鞍山师范学院 一种基于学术大数据的论文影响力预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
俞立平: "影响力指数:一个评价学术期刊影响力的新指标", 《图书与情报》 *
张建合: "影响因子中的期刊自引成分分析", 《信阳师范学院学报(自然科学版)》 *
张慧玲 等: "学术期刊影响力评价方法研究进展", 《图书情报工作》 *
邵作运 等: "f(x)指数:期刊学术影响力评价新指标", 《中国科技期刊研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115307644A (zh) * 2022-08-25 2022-11-08 西南石油大学 一种基于uwb的三维定位模型

Similar Documents

Publication Publication Date Title
CN105260474B (zh) 一种基于信息交互网络的微博用户影响力计算方法
CN105574159B (zh) 一种基于大数据的用户画像建立方法和用户画像管理系统
JP5560367B2 (ja) ネットワーク内の友人の動的情報を管理するための方法、システムおよびサーバ
CN105373597B (zh) 基于k‑medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法
CN103577432B (zh) 一种商品信息搜索方法和系统
US20070220037A1 (en) Expansion phrase database for abbreviated terms
CN103514181B (zh) 一种搜索方法和装置
CN110795758B (zh) 一种基于差分隐私的非等距直方图发布方法
CN102768664A (zh) 分布式网页广告拦截的方法及系统
CN107239458A (zh) 基于大数据推算开发对象关系的方法及装置
CN107277115A (zh) 一种内容推送方法及装置
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN110189051A (zh) 一种考虑引用异常值的期刊学术影响力的评估方法
Rai et al. A Bibliometric Analysis of Deep Web Research during 1997-2019.
CN101308507B (zh) 互联网信息发布和搜索方法
CN107862620A (zh) 一种基于社交数据的相似用户挖掘方法
CN104331490B (zh) 网络数据处理方法及装置
CN110232525A (zh) 一种企业风险监控方法、装置、服务器及存储介质
CN104216901B (zh) 信息搜索的方法和系统
Shin et al. Impact and degree of user sociability in social media
CN110417765A (zh) 一种基于信任的托攻击用户的检测方法及系统
US20180322214A1 (en) Data display method
CN109145633A (zh) 轨迹数据隐私保护方法、电子设备、存储介质及系统
KR101791418B1 (ko) 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템
CN106560808A (zh) 一种计算互联网关键词的检索精度的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190830

RJ01 Rejection of invention patent application after publication