CN107273431A - 一种基于大数据的文献参考价值评估系统和方法 - Google Patents
一种基于大数据的文献参考价值评估系统和方法 Download PDFInfo
- Publication number
- CN107273431A CN107273431A CN201710367304.5A CN201710367304A CN107273431A CN 107273431 A CN107273431 A CN 107273431A CN 201710367304 A CN201710367304 A CN 201710367304A CN 107273431 A CN107273431 A CN 107273431A
- Authority
- CN
- China
- Prior art keywords
- target literature
- fraction
- big data
- literature
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于大数据的文献参考价值评估系统和方法,所述系统包括:大数据获取模块,用于获取目标文献本体信息和目标文献被操作次数;大数据内部分析模块,用于根据目标文献本体信息计算目标文献的内部分数Z1;大数据外部分析模块,用于根据目标文献被操作次数计算目标文献的外部分数Z2;大数据加权分析模块,用于根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z1+ω2Z2,ω1+ω2=1;大数据展示模块,用于可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
Description
技术领域
本发明涉及计算机评估技术领域,尤其涉及一种基于大数据的文献参考价值评估系统和方法。
背景技术
随着科学技术的发展,从事科学研究的人员数量越来越多,研究成果通过以论文、书刊、文章等形式进行呈现,由于互联网的便利,在互联网上这些研究人员产生了数以亿计的研究数据,这些数据统称为大数据。当人们在使用这些大数据时,往往会淹没在这些数据海洋中,往往花费很长的时间仍然难以找到自己需要的参考文献,第一,是由于这些文献的数量太庞大;第二,是因为这些文献没有一个价值评价标准;往往人们只能通过标题对文献内容有一定的了解,在花费大量时间阅读后发现文献并没有什么参考价值,这给阅读者带来很不好的体验,而往往阅读文献的时间远远大于检索文献的时间。
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于大数据的文献参考价值评估系统和方法;
本发明提出的一种基于大数据的文献参考价值评估系统,包括:
大数据获取模块,用于获取目标文献本体信息和目标文献被操作次数;
大数据内部分析模块,用于根据目标文献本体信息计算目标文献的内部分数Z1;
大数据外部分析模块,用于根据目标文献被操作次数计算目标文献的外部分数Z2;
大数据加权分析模块,用于根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z1+ω2Z2,ω1+ω2=1;
大数据展示模块,用于可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
优选地,所述大数据获取模块,具体用于:获取目标文献本体信息,所述目标文献本体信息包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;
优选地,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
优选地,所述大数据获取模块,具体用于:获取目标文献被操作信息,所述目标文献被操作次数包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
优选地,所述大数据内部分析模块,具体用于:目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
优选地,所述大数据外部分析模块,具体用于:目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
一种基于大数据的文献参考价值评估方法,包括:
S1、获取目标文献本体信息和目标文献被操作次数;
S2、根据目标文献本体信息计算目标文献的内部分数Z1;
S3、根据目标文献被操作次数计算目标文献的外部分数Z2;
S4、根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z1+ω2Z2,ω1+ω2=1;
S5、可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
优选地,步骤S1中,所述目标文献本体信息,具体包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;
优选地,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
优选地,步骤S1中,所述目标文献被操作次数,具体包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
优选地,步骤S2,具体包括:目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
优选地,步骤S3,具体包括:目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
本发明通过获取目标文献本体信息和目标文献被操作次数,根据目标文献本体信息按照预设比例计算目标文献的内部分数,根据目标文献被操作次数和目标文献被操作次数按照预设比例计算目标文献的外部分数,再根据预设权值对目标文献的内部分数和目标文献的外部分数进行加权求和计算,得到目标文献可参考分数,然后将这些内部分数、外部分数、目标文献可参考分数向阅读者展示,如此,从文献本体内容、其他阅读者对文献的操作、结合文献本体内容和其他阅读者对文献的操作三个方面对文献进行评估,在阅读者打开文献之前,向阅读者展示这三个方面的评估分数,给阅读者提供阅读及引用的参考价值,方便阅读者从大数据库中找到自己需要的参考文献,节省大量时间,提高检索和阅读效率,提升用户体验。
附图说明
图1为本发明提出的一种基于大数据的文献参考价值评估系统的模块示意图;
图2为本发明提出的一种基于大数据的文献参考价值评估方法的流程示意图。
具体实施方式
参照图1,本发明提出的一种基于大数据的文献参考价值评估系统,包括:
大数据获取模块,用于获取目标文献本体信息和目标文献被操作次数。
其中,所述目标文献本体信息包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
其中,所述目标文献被操作次数包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
在具体方案中,通过网络爬虫获取文献本体信息和目标文献被操作次数,目标文献本体信息包括文献作者的姓名、职业、职称、毕业院校、学历、发表论文数量和获奖信息,文献研究领域和研究方向以及文献的新颖度,目标文献被操作次数包括其他阅读者对文献被阅读次数、其他阅读者引用文献的次数、文献被发表次数。
大数据内部分析模块,与大数据获取模块连接,用于根据目标文献本体信息计算目标文献的内部分数Z1,目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
在具体方案中,文献作者的学术成就和出版物数量体现出一篇文献的影响力,文献作者的影响力越大,该作者的文献影响力越大,文献的选题、确定研究领域和研究方向,是研究的开始,直接影响研究文献的价值,由于每一篇文献都是在前人研究成果基础上的,所以文献的新颖度(独创性),文献在观点上或在方法上,是否有所突破是否有所创造是文献优劣的生命线。
大数据外部分析模块,与大数据获取模块连接,用于根据目标文献被操作次数计算目标文献的外部分数Z2,目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数;
在具体方案中,文献被阅读次数、文献被引用次数、文献被发表次数从阅读者和使用者角度体现出一篇文献的价值,文献被阅读次数、文献被引用次数和文献被发表次数越多,说明所述文献的影响力越大,从而体现出文献的价值。
大数据加权分析模块,分别与大数据内部分析模块和大数据外部分析模块连接,用于根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z1+ω2Z2,ω1+ω2=1;
在具体方案中,综合目标文献的内部分数、目标文献的外部分数和预设权值对目标文献进行加权求和计算,从内部分数和外部分数的重要性出发,进行加权求和计算,得到目标文献可参考分数,给阅读者和使用者一个参考。
大数据展示模块,分别与大数据内部分析模块、大数据外部分析模块连接和大数据加权分析模块连接,用于可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
在具体方案中,通过柱状图、雷达图、曲线图、曲线图展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
参照图2,本发明提出的一种基于大数据的文献参考价值评估方法,包括:
步骤S1,获取目标文献本体信息和目标文献被操作次数;
本步骤中,所述目标文献本体信息,具体包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;其中,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
本步骤中,所述目标文献被操作次数,具体包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
在具体方案中,通过网络爬虫获取文献本体信息和目标文献被操作次数,目标文献本体信息包括文献作者的姓名、职业、职称、毕业院校、学历、发表论文数量和获奖信息,文献研究领域和研究方向以及文献的新颖度,目标文献被操作次数包括其他阅读者对文献被阅读次数、其他阅读者引用文献的次数、文献被发表次数。
步骤S2,根据目标文献本体信息计算目标文献的内部分数Z1,目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
在具体方案中,文献作者的学术成就和出版物数量体现出一篇文献的影响力,文献作者的影响力越大,该作者的文献影响力越大,文献的选题、确定研究领域和研究方向,是研究的开始,直接影响研究文献的价值,由于每一篇文献都是在前人研究成果基础上的,所以文献的新颖度(独创性),文献在观点上或在方法上,是否有所突破是否有所创造是文献优劣的生命线。
步骤S3,根据目标文献被操作次数计算目标文献的外部分数Z2,目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
在具体方案中,文献被阅读次数、文献被引用次数、文献被发表次数从阅读者和使用者角度体现出一篇文献的价值,文献被阅读次数、文献被引用次数和文献被发表次数越多,说明所述文献的影响力越大,从而体现出文献的价值。
步骤S4,根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z1+ω2Z2,ω1+ω2=1;
在具体方案中,综合目标文献的内部分数、目标文献的外部分数和预设权值对目标文献进行加权求和计算,从内部分数和外部分数的重要性出发,进行加权求和计算,得到目标文献可参考分数,给阅读者和使用者一个参考。
步骤S5,可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
在具体方案中,通过柱状图、雷达图、曲线图、曲线图展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z
本实施方式通过获取目标文献本体信息和目标文献被操作次数,根据目标文献本体信息按照预设比例计算目标文献的内部分数,根据目标文献被操作次数和目标文献被操作次数按照预设比例计算目标文献的外部分数,再根据预设权值对目标文献的内部分数和目标文献的外部分数进行加权求和计算,得到目标文献可参考分数,然后将这些内部分数、外部分数、目标文献可参考分数向阅读者展示,如此,从文献本体内容、其他阅读者对文献的操作、结合文献本体内容和其他阅读者对文献的操作三个方面对文献进行评估,在阅读者打开文献之前,向阅读者展示这三个方面的评估分数,给阅读者提供阅读及引用的参考价值,方便阅读者从大数据库中找到自己需要的参考文献,节省大量时间,提高检索和阅读效率,提升用户体验。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于大数据的文献参考价值评估系统,其特征在于,包括:
大数据获取模块,用于获取目标文献本体信息和目标文献被操作次数;
大数据内部分析模块,用于根据目标文献本体信息计算目标文献的内部分数Z1;
大数据外部分析模块,用于根据目标文献被操作次数计算目标文献的外部分数Z2;
大数据加权分析模块,用于根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z1+ω2Z2,ω1+ω2=1;
大数据展示模块,用于可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
2.根据权利要求1所述的基于大数据的文献参考价值评估系统,其特征在于,所述大数据获取模块,具体用于:获取目标文献本体信息,所述目标文献本体信息包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;
优选地,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
3.根据权利要求1所述的基于大数据的文献参考价值评估系统,其特征在于,所述大数据获取模块,具体用于:获取目标文献被操作信息,所述目标文献被操作次数包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
4.根据权利要求2所述的基于大数据的文献参考价值评估系统,其特征在于,所述大数据内部分析模块,具体用于:目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
5.根据权利要求3所述的基于大数据的文献参考价值评估系统,其特征在于,所述大数据外部分析模块,具体用于:目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
6.一种基于大数据的文献参考价值评估方法,其特征在于,包括:
S1、获取目标文献本体信息和目标文献被操作次数;
S2、根据目标文献本体信息计算目标文献的内部分数Z1;
S3、根据目标文献被操作次数计算目标文献的外部分数Z2;
S4、根据预设权值对目标文献的内部分数Z1和目标文献的外部分数Z2进行加权求和计算,得到目标文献可参考分数Z=ω1Z1+ω2Z2,ω1+ω2=1;
S5、可视化展示目标文献的内部分数Z1、目标文献的外部分数Z2和目标文献可参考分数Z。
7.根据权利要求6所述的基于大数据的文献参考价值评估方法,其特征在于,步骤S1中,所述目标文献本体信息,具体包括:作者信息、研究领域、新颖度,所述新颖度表示所述目标文献与大数据网络中其他文章的相似度;
优选地,所述作者信息,包括:姓名、职业、职称、毕业院校、学历、发表论文数量、获奖信息中一种或多种。
8.根据权利要求6所述的基于大数据的文献参考价值评估方法,其特征在于,步骤S1中,所述目标文献被操作次数,具体包括:文献被阅读次数、文献被引用次数、文献被发表次数中一者或多者。
9.根据权利要求7所述的基于大数据的文献参考价值评估方法,其特征在于,步骤S2,具体包括:目标文献的内部分数Z1=aL+bM+cN,a+b+c=1,其中,L表示作者信息分值,M表示研究领域分值,N表示新颖度分值,a、b、c表示比例系数。
10.根据权利要求8所述的基于大数据的文献参考价值评估方法,其特征在于,步骤S3,具体包括:目标文献的外部分数Z2=iR+jS+kT,i+j+k=1,R表示文献被阅读次数、S文献被引用次数、T文献被发表次数,i、j、k表示比例系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710367304.5A CN107273431A (zh) | 2017-05-23 | 2017-05-23 | 一种基于大数据的文献参考价值评估系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710367304.5A CN107273431A (zh) | 2017-05-23 | 2017-05-23 | 一种基于大数据的文献参考价值评估系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107273431A true CN107273431A (zh) | 2017-10-20 |
Family
ID=60064087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710367304.5A Pending CN107273431A (zh) | 2017-05-23 | 2017-05-23 | 一种基于大数据的文献参考价值评估系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107273431A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108897832A (zh) * | 2018-06-22 | 2018-11-27 | 申报家(广州)智能科技发展有限公司 | 一种自动分析价值信息的方法与装置 |
CN110175774A (zh) * | 2019-05-24 | 2019-08-27 | 中译语通科技股份有限公司 | 文献价值评估方法和装置 |
CN110502618A (zh) * | 2018-05-16 | 2019-11-26 | 北京理工大学 | 一种文献大数据的可视化方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440329A (zh) * | 2013-09-04 | 2013-12-11 | 北京邮电大学 | 权威作者和高质量论文推荐系统和推荐方法 |
-
2017
- 2017-05-23 CN CN201710367304.5A patent/CN107273431A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440329A (zh) * | 2013-09-04 | 2013-12-11 | 北京邮电大学 | 权威作者和高质量论文推荐系统和推荐方法 |
Non-Patent Citations (1)
Title |
---|
门瑞: "高质量个性化论文推荐系统研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110502618A (zh) * | 2018-05-16 | 2019-11-26 | 北京理工大学 | 一种文献大数据的可视化方法 |
CN108897832A (zh) * | 2018-06-22 | 2018-11-27 | 申报家(广州)智能科技发展有限公司 | 一种自动分析价值信息的方法与装置 |
CN108897832B (zh) * | 2018-06-22 | 2021-09-03 | 申报家(广州)智能科技发展有限公司 | 一种自动分析价值信息的方法与装置 |
CN110175774A (zh) * | 2019-05-24 | 2019-08-27 | 中译语通科技股份有限公司 | 文献价值评估方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Solís-Radilla et al. | The Importance of Sustainability in the Loyalty to a Tourist Destination through the Management of Expectations and Experiences | |
CN107273431A (zh) | 一种基于大数据的文献参考价值评估系统和方法 | |
Toprak et al. | Teachers’ moral intelligence: A scale adaptation into Turkish and preliminary evidence | |
Ruban et al. | Unique geology and climbing: a literature review | |
de Almeida et al. | Scaling issues in additive multicriteria portfolio analysis | |
Williams | Economic impacts from development of the coastal town in Queensland on tourism and regional economy | |
Ariza-Montes et al. | Job quality and work engagement in the cruise industry | |
Meyer et al. | Food next door: from food literacy to citizenship on a college campus | |
Potts | The good, the bad, and the statutory: are statutory or non-statutory natural resource management plans higher in quality? | |
Löther | Is it working? An impact evaluation of the German “Women Professors Program” | |
Lopes et al. | Application of a Decision-Making Tool for Ranking Wellness Tourism Destinations | |
Abdul Aziz et al. | Community participation in the importance of living heritage conservation and its relationships with the community-based education model towards creating a sustainable community in Melaka UNESCO world heritage site | |
Payne* et al. | REIT markets: periodically collapsing negative bubbles? | |
Delaney et al. | Policy innovation and tertiary education graduation rates: a cross-country analysis | |
Khazami et al. | Influence of experiential consumption and social environment of local tourists on the intention to revisit Tunisian guesthouses: Mediating role of involvement in the experience | |
Schabas | Constructing “the economy” | |
Greene et al. | A resilience-enhancing stress model: A social work multisystemic practice approach | |
Wagner | Distance-sensitivity of German exports: first evidence from firm-product level data | |
Morris | Rankings and the reshaping of higher education: the battle for world class excellence | |
Zach et al. | Topic modelling tourism literature on innovation and technology | |
Berrezueta et al. | Perception of local communities on the sociocultural impacts of rural tourism. Case of Bellavista, El Oro, Ecuador | |
Barros | Demand analysis in Angola seaports | |
Brubaker et al. | A Debtor World: Interdisciplinary Perspectives on Debt | |
Kent | Maps> representation | |
Lamedica et al. | Integration of international bond markets: did anything change with EMU? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171020 |