CN107273431A - 一种基于大数据的文献参考价值评估系统和方法 - Google Patents

一种基于大数据的文献参考价值评估系统和方法 Download PDF

Info

Publication number
CN107273431A
CN107273431A CN201710367304.5A CN201710367304A CN107273431A CN 107273431 A CN107273431 A CN 107273431A CN 201710367304 A CN201710367304 A CN 201710367304A CN 107273431 A CN107273431 A CN 107273431A
Authority
CN
China
Prior art keywords
target literature
fraction
big data
literature
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710367304.5A
Other languages
English (en)
Inventor
周钰徐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Intellectual Property Mdt Infotech Ltd
Original Assignee
Hefei Intellectual Property Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Intellectual Property Mdt Infotech Ltd filed Critical Hefei Intellectual Property Mdt Infotech Ltd
Priority to CN201710367304.5A priority Critical patent/CN107273431A/zh
Publication of CN107273431A publication Critical patent/CN107273431A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的文献参考价值评估系统和方法,所述系统包括:大数据获取模块,用于获取目标文献本体信息和目标文献被操作次数;大数据内部分析模块,用于根据目标文献本体信息计算目标文献的内部分数Z1;大数据外部分析模块,用于根据目标文献被操作次数计算目标文献的外部分数Z2;大数据加权分析模块,用于根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z12Z2,ω12=1;大数据展示模块,用于可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。

Description

一种基于大数据的文献参考价值评估系统和方法
技术领域
本发明涉及计算机评估技术领域,尤其涉及一种基于大数据的文献参考价值评估系统和方法。
背景技术
随着科学技术的发展,从事科学研究的人员数量越来越多,研究成果通过以论文、书刊、文章等形式进行呈现,由于互联网的便利,在互联网上这些研究人员产生了数以亿计的研究数据,这些数据统称为大数据。当人们在使用这些大数据时,往往会淹没在这些数据海洋中,往往花费很长的时间仍然难以找到自己需要的参考文献,第一,是由于这些文献的数量太庞大;第二,是因为这些文献没有一个价值评价标准;往往人们只能通过标题对文献内容有一定的了解,在花费大量时间阅读后发现文献并没有什么参考价值,这给阅读者带来很不好的体验,而往往阅读文献的时间远远大于检索文献的时间。
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于大数据的文献参考价值评估系统和方法;
本发明提出的一种基于大数据的文献参考价值评估系统,包括:
大数据获取模块,用于获取目标文献本体信息和目标文献被操作次数;
大数据内部分析模块,用于根据目标文献本体信息计算目标文献的内部分数Z1
大数据外部分析模块,用于根据目标文献被操作次数计算目标文献的外部分数Z2
大数据加权分析模块,用于根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z12Z2,ω12=1;
大数据展示模块,用于可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
优选地,所述大数据获取模块,具体用于:获取目标文献本体信息,所述目标文献本体信息包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;
优选地,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
优选地,所述大数据获取模块,具体用于:获取目标文献被操作信息,所述目标文献被操作次数包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
优选地,所述大数据内部分析模块,具体用于:目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
优选地,所述大数据外部分析模块,具体用于:目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
一种基于大数据的文献参考价值评估方法,包括:
S1、获取目标文献本体信息和目标文献被操作次数;
S2、根据目标文献本体信息计算目标文献的内部分数Z1
S3、根据目标文献被操作次数计算目标文献的外部分数Z2
S4、根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z12Z2,ω12=1;
S5、可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
优选地,步骤S1中,所述目标文献本体信息,具体包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;
优选地,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
优选地,步骤S1中,所述目标文献被操作次数,具体包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
优选地,步骤S2,具体包括:目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
优选地,步骤S3,具体包括:目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
本发明通过获取目标文献本体信息和目标文献被操作次数,根据目标文献本体信息按照预设比例计算目标文献的内部分数,根据目标文献被操作次数和目标文献被操作次数按照预设比例计算目标文献的外部分数,再根据预设权值对目标文献的内部分数和目标文献的外部分数进行加权求和计算,得到目标文献可参考分数,然后将这些内部分数、外部分数、目标文献可参考分数向阅读者展示,如此,从文献本体内容、其他阅读者对文献的操作、结合文献本体内容和其他阅读者对文献的操作三个方面对文献进行评估,在阅读者打开文献之前,向阅读者展示这三个方面的评估分数,给阅读者提供阅读及引用的参考价值,方便阅读者从大数据库中找到自己需要的参考文献,节省大量时间,提高检索和阅读效率,提升用户体验。
附图说明
图1为本发明提出的一种基于大数据的文献参考价值评估系统的模块示意图;
图2为本发明提出的一种基于大数据的文献参考价值评估方法的流程示意图。
具体实施方式
参照图1,本发明提出的一种基于大数据的文献参考价值评估系统,包括:
大数据获取模块,用于获取目标文献本体信息和目标文献被操作次数。
其中,所述目标文献本体信息包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
其中,所述目标文献被操作次数包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
在具体方案中,通过网络爬虫获取文献本体信息和目标文献被操作次数,目标文献本体信息包括文献作者的姓名、职业、职称、毕业院校、学历、发表论文数量和获奖信息,文献研究领域和研究方向以及文献的新颖度,目标文献被操作次数包括其他阅读者对文献被阅读次数、其他阅读者引用文献的次数、文献被发表次数。
大数据内部分析模块,与大数据获取模块连接,用于根据目标文献本体信息计算目标文献的内部分数Z1,目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
在具体方案中,文献作者的学术成就和出版物数量体现出一篇文献的影响力,文献作者的影响力越大,该作者的文献影响力越大,文献的选题、确定研究领域和研究方向,是研究的开始,直接影响研究文献的价值,由于每一篇文献都是在前人研究成果基础上的,所以文献的新颖度(独创性),文献在观点上或在方法上,是否有所突破是否有所创造是文献优劣的生命线。
大数据外部分析模块,与大数据获取模块连接,用于根据目标文献被操作次数计算目标文献的外部分数Z2,目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数;
在具体方案中,文献被阅读次数、文献被引用次数、文献被发表次数从阅读者和使用者角度体现出一篇文献的价值,文献被阅读次数、文献被引用次数和文献被发表次数越多,说明所述文献的影响力越大,从而体现出文献的价值。
大数据加权分析模块,分别与大数据内部分析模块和大数据外部分析模块连接,用于根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z12Z2,ω12=1;
在具体方案中,综合目标文献的内部分数、目标文献的外部分数和预设权值对目标文献进行加权求和计算,从内部分数和外部分数的重要性出发,进行加权求和计算,得到目标文献可参考分数,给阅读者和使用者一个参考。
大数据展示模块,分别与大数据内部分析模块、大数据外部分析模块连接和大数据加权分析模块连接,用于可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
在具体方案中,通过柱状图、雷达图、曲线图、曲线图展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
参照图2,本发明提出的一种基于大数据的文献参考价值评估方法,包括:
步骤S1,获取目标文献本体信息和目标文献被操作次数;
本步骤中,所述目标文献本体信息,具体包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;其中,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
本步骤中,所述目标文献被操作次数,具体包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
在具体方案中,通过网络爬虫获取文献本体信息和目标文献被操作次数,目标文献本体信息包括文献作者的姓名、职业、职称、毕业院校、学历、发表论文数量和获奖信息,文献研究领域和研究方向以及文献的新颖度,目标文献被操作次数包括其他阅读者对文献被阅读次数、其他阅读者引用文献的次数、文献被发表次数。
步骤S2,根据目标文献本体信息计算目标文献的内部分数Z1,目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
在具体方案中,文献作者的学术成就和出版物数量体现出一篇文献的影响力,文献作者的影响力越大,该作者的文献影响力越大,文献的选题、确定研究领域和研究方向,是研究的开始,直接影响研究文献的价值,由于每一篇文献都是在前人研究成果基础上的,所以文献的新颖度(独创性),文献在观点上或在方法上,是否有所突破是否有所创造是文献优劣的生命线。
步骤S3,根据目标文献被操作次数计算目标文献的外部分数Z2,目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
在具体方案中,文献被阅读次数、文献被引用次数、文献被发表次数从阅读者和使用者角度体现出一篇文献的价值,文献被阅读次数、文献被引用次数和文献被发表次数越多,说明所述文献的影响力越大,从而体现出文献的价值。
步骤S4,根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z12Z2,ω12=1;
在具体方案中,综合目标文献的内部分数、目标文献的外部分数和预设权值对目标文献进行加权求和计算,从内部分数和外部分数的重要性出发,进行加权求和计算,得到目标文献可参考分数,给阅读者和使用者一个参考。
步骤S5,可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
在具体方案中,通过柱状图、雷达图、曲线图、曲线图展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z
本实施方式通过获取目标文献本体信息和目标文献被操作次数,根据目标文献本体信息按照预设比例计算目标文献的内部分数,根据目标文献被操作次数和目标文献被操作次数按照预设比例计算目标文献的外部分数,再根据预设权值对目标文献的内部分数和目标文献的外部分数进行加权求和计算,得到目标文献可参考分数,然后将这些内部分数、外部分数、目标文献可参考分数向阅读者展示,如此,从文献本体内容、其他阅读者对文献的操作、结合文献本体内容和其他阅读者对文献的操作三个方面对文献进行评估,在阅读者打开文献之前,向阅读者展示这三个方面的评估分数,给阅读者提供阅读及引用的参考价值,方便阅读者从大数据库中找到自己需要的参考文献,节省大量时间,提高检索和阅读效率,提升用户体验。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于大数据的文献参考价值评估系统,其特征在于,包括:
大数据获取模块,用于获取目标文献本体信息和目标文献被操作次数;
大数据内部分析模块,用于根据目标文献本体信息计算目标文献的内部分数Z1
大数据外部分析模块,用于根据目标文献被操作次数计算目标文献的外部分数Z2
大数据加权分析模块,用于根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z12Z2,ω12=1;
大数据展示模块,用于可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
2.根据权利要求1所述的基于大数据的文献参考价值评估系统,其特征在于,所述大数据获取模块,具体用于:获取目标文献本体信息,所述目标文献本体信息包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;
优选地,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
3.根据权利要求1所述的基于大数据的文献参考价值评估系统,其特征在于,所述大数据获取模块,具体用于:获取目标文献被操作信息,所述目标文献被操作次数包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
4.根据权利要求2所述的基于大数据的文献参考价值评估系统,其特征在于,所述大数据内部分析模块,具体用于:目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
5.根据权利要求3所述的基于大数据的文献参考价值评估系统,其特征在于,所述大数据外部分析模块,具体用于:目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
6.一种基于大数据的文献参考价值评估方法,其特征在于,包括:
S1、获取目标文献本体信息和目标文献被操作次数;
S2、根据目标文献本体信息计算目标文献的内部分数Z1
S3、根据目标文献被操作次数计算目标文献的外部分数Z2
S4、根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z12Z2,ω12=1;
S5、可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
7.根据权利要求6所述的基于大数据的文献参考价值评估方法,其特征在于,步骤S1中,所述目标文献本体信息,具体包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;
优选地,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
8.根据权利要求6所述的基于大数据的文献参考价值评估方法,其特征在于,步骤S1中,所述目标文献被操作次数,具体包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
9.根据权利要求7所述的基于大数据的文献参考价值评估方法,其特征在于,步骤S2,具体包括:目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
10.根据权利要求8所述的基于大数据的文献参考价值评估方法,其特征在于,步骤S3,具体包括:目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
CN201710367304.5A 2017-05-23 2017-05-23 一种基于大数据的文献参考价值评估系统和方法 Pending CN107273431A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710367304.5A CN107273431A (zh) 2017-05-23 2017-05-23 一种基于大数据的文献参考价值评估系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710367304.5A CN107273431A (zh) 2017-05-23 2017-05-23 一种基于大数据的文献参考价值评估系统和方法

Publications (1)

Publication Number Publication Date
CN107273431A true CN107273431A (zh) 2017-10-20

Family

ID=60064087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710367304.5A Pending CN107273431A (zh) 2017-05-23 2017-05-23 一种基于大数据的文献参考价值评估系统和方法

Country Status (1)

Country Link
CN (1) CN107273431A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108897832A (zh) * 2018-06-22 2018-11-27 申报家(广州)智能科技发展有限公司 一种自动分析价值信息的方法与装置
CN110175774A (zh) * 2019-05-24 2019-08-27 中译语通科技股份有限公司 文献价值评估方法和装置
CN110502618A (zh) * 2018-05-16 2019-11-26 北京理工大学 一种文献大数据的可视化方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440329A (zh) * 2013-09-04 2013-12-11 北京邮电大学 权威作者和高质量论文推荐系统和推荐方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440329A (zh) * 2013-09-04 2013-12-11 北京邮电大学 权威作者和高质量论文推荐系统和推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
门瑞: "高质量个性化论文推荐系统研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502618A (zh) * 2018-05-16 2019-11-26 北京理工大学 一种文献大数据的可视化方法
CN108897832A (zh) * 2018-06-22 2018-11-27 申报家(广州)智能科技发展有限公司 一种自动分析价值信息的方法与装置
CN108897832B (zh) * 2018-06-22 2021-09-03 申报家(广州)智能科技发展有限公司 一种自动分析价值信息的方法与装置
CN110175774A (zh) * 2019-05-24 2019-08-27 中译语通科技股份有限公司 文献价值评估方法和装置

Similar Documents

Publication Publication Date Title
Deng et al. Linking importance–performance analysis, satisfaction, and loyalty: A study of Savannah, GA
Hardwick Practice of Patriarchy: Gender and the Politics of Household authority in early modern France
Solís-Radilla et al. The Importance of Sustainability in the Loyalty to a Tourist Destination through the Management of Expectations and Experiences
CN107273431A (zh) 一种基于大数据的文献参考价值评估系统和方法
Toprak et al. Teachers’ moral intelligence: A scale adaptation into Turkish and preliminary evidence
Ruban et al. Unique geology and climbing: a literature review
de Almeida et al. Scaling issues in additive multicriteria portfolio analysis
Williams Economic impacts from development of the coastal town in Queensland on tourism and regional economy
Meyer et al. Food next door: from food literacy to citizenship on a college campus
Ariza-Montes et al. Job quality and work engagement in the cruise industry
Potts The good, the bad, and the statutory: are statutory or non-statutory natural resource management plans higher in quality?
Löther Is it working? An impact evaluation of the German “Women Professors Program”
Lopes et al. Application of a Decision-Making Tool for Ranking Wellness Tourism Destinations
Payne* et al. REIT markets: periodically collapsing negative bubbles?
Wojciechowska-Solis et al. Identification of the Quality Gaps in the Services Offered in Accommodation Facilities in Rural Areas: The Case of the Lublin Region
Greene et al. A resilience-enhancing stress model: A social work multisystemic practice approach
Morris Rankings and the reshaping of higher education: the battle for world class excellence
Gómez-Bezares et al. Classic performance indexes revisited: axiomatic and applications
Barros Demand analysis in Angola seaports
Brubaker et al. A Debtor World: Interdisciplinary Perspectives on Debt
Zhang et al. Globalization, Country Risks, and Trade in Tourism Services: Evidence from China
Kent Maps> representation
Lamedica et al. Integration of international bond markets: did anything change with EMU?
McLean et al. Investing in medical students: which ones are worth a surgeon's time?
Hecht Joel Berger: Review of Extreme Conservation: Life at the Edges of the World: University of Chicago Press, 2018. ISBN-13: 9780226366265 (Cloth), $30.00. 368 pages

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171020