CN110502618A - 一种文献大数据的可视化方法 - Google Patents

一种文献大数据的可视化方法 Download PDF

Info

Publication number
CN110502618A
CN110502618A CN201810467348.XA CN201810467348A CN110502618A CN 110502618 A CN110502618 A CN 110502618A CN 201810467348 A CN201810467348 A CN 201810467348A CN 110502618 A CN110502618 A CN 110502618A
Authority
CN
China
Prior art keywords
document
literature
visualizing
data
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810467348.XA
Other languages
English (en)
Inventor
汤海京
付大军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Beijing Institute of Technology BIT
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201810467348.XA priority Critical patent/CN110502618A/zh
Publication of CN110502618A publication Critical patent/CN110502618A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种文献大数据的可视化方法,包括以下步骤:1)用户输入检索条件,依据该条件在索引词数据库中检索、生成相匹配的索引词;2)对步骤1)所述的索引词点选,即可查看相关文献、本体数据及引用网络;3)对步骤2)所述的文献数据进行可视化的参考价值评估;4)系统针对用户进行个性化文献数据推荐。本发明的文献大数据的可视化方法为用户提供个性化文献数据推荐,有利于用户寻找新的研究思路,从而加快研究进程,提供了便捷、易用、直观、准确的文献大数据可视化方法。

Description

一种文献大数据的可视化方法
技术领域
本发明涉及一种文献大数据的可视化方法。
背景技术
随着信息技术的发展,每个行业都面临着海量数据的问题,人们不仅仅是对数据进行管理,还要从大量的数据中获得全面的知识和信息,以便对数据进行分析。
随着学术研究的蓬勃发展,文献资料数量也越来越多,对于文献数据分析的需求也日益凸显。面对海量文献数据,人们往往花费较长时间仍难以找到自己需要的文献资料,当读者不熟悉检索内容时,检索方式的有效性较差,且容易忽略文献中的长尾部分。此外,现有方法割裂了文献间的宏观联系,无法展示文献引用网络,无法帮助用户对文献进行价值评估,帮助了解目前热门学科、各研究领域的主要人员和各领域发展动态,无法进行论文推荐等等。
本发明的目的是致力于解决目前文献大数据的可视化分析方法匮乏的现状,提出一种可视化的文献大数据分析方法。
发明内容
为解决上述技术问题,本发明提供一种文献大数据的可视化方法。
本发明的文献大数据的可视化方法,包括以下步骤:
1)用户输入检索条件,依据该条件在索引词数据库中检索、生成相匹配的索引词;
2)对步骤1)所述的索引词点选,即可查看相关文献、本体数据及引用网络;
3)对步骤2)所述的文献数据进行可视化的参考价值评估;
4)系统针对用户进行个性化文献数据推荐。
本发明的文献大数据的可视化方法,在步骤1)中,所述检索条件默认为第一检索条件,即优选关键词,用户可自主添加次级、三级检索条件等。
本发明的文献大数据的可视化方法,在步骤1)中,所述检索条件与检索结果存在可视化的关联度分析对比。
本发明的文献大数据的可视化方法,在步骤2)中,所述本体数据包括作者信息、研究领域、新颖度、被操作次数,所述新颖度表示目标文献与其他文献的相似度,被操作次数为文献被阅读次数、文献被引用次数、文献被发表次数等。
本发明的文献大数据的可视化方法,在步骤2)中,所述引用网络包括作者间、论文间引用关系,作者和论文间的著作关系,以及论文间和作者间的引用关系;并通过柱状图、雷达图、热图等对一或多个文献数据的本体数据及引用网络进行可视化图表展示。
本发明的文献大数据的可视化方法,在步骤3)中,所述参考价值评估包括文献数据内部分析、外部分析及加权分析;内部分析为根据预设权值对目标文献的作者信息分值、研究领域分值、新颖度分值进行加权计算;外部分析为根据预设权值对目标文献的被阅读次数、被引用次数、被发表次数进行加权计算;加权分析为根据预设权值对目标文献的内部分析值、外部分析值进行加权计算;上述权值均支持用户自由设置。
本发明的文献大数据的可视化方法,在步骤4)中,所述个性化文献数据推荐:系统根据索引词、引用网络、参考价值评估等综合数据,基于用户进行个性化文献推荐。
本发明的文献大数据的可视化方法,在步骤4)中,所述个性化文献数据推荐:用户浏览后感兴趣的能够保存到相应的文献列表中,若为用户不感兴趣的,则删除推荐结果中对应的文献。
与现有技术相比本发明的有益效果为:
1)立足于信息计量分析领域,并致力于打造提供面向文献大数据的整体数据服务及解决方案;
2)提供文献数据精准化索引;
3)有针对性的对文献进行本体数据展示、引用网络分析、参考价值评估,解决了传统文献数据展示形式单一的痛点;
4)为用户提供个性化文献数据推荐,有利于用户寻找新的研究思路,从而加快研究进程。
附图说明
图1是本发明实施例所述的一种文献大数据的可视化方法的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,一种文献大数据的可视化方法,包括以下步骤:
1)用户输入检索条件,依据该条件在索引词数据库中检索、生成相匹配的索引词;
2)对步骤1)所述的索引词点选,即可查看相关文献、本体数据及引用网络;
3)对步骤2)所述的文献数据进行可视化的参考价值评估;
4)系统针对用户进行个性化文献数据推荐。
本发明的文献大数据的可视化方法,在步骤1)中,所述检索条件默认为第一检索条件,即优选关键词,用户可自主添加次级、三级检索条件等。
本发明的文献大数据的可视化方法,在步骤1)中,所述检索条件与检索结果存在可视化的关联度分析对比。
本发明的文献大数据的可视化方法,在步骤2)中,所述本体数据包括作者信息、研究领域、新颖度、被操作次数,所述新颖度表示目标文献与其他文献的相似度,被操作次数为文献被阅读次数、文献被引用次数、文献被发表次数等。
本发明的文献大数据的可视化方法,在步骤2)中,所述引用网络包括作者间、论文间引用关系,作者和论文间的著作关系,以及论文间和作者间的引用关系;并通过柱状图、雷达图、热图等对一或多个文献数据的本体数据及引用网络进行可视化图表展示。
本发明的文献大数据的可视化方法,在步骤3)中,所述参考价值评估包括文献数据内部分析、外部分析及加权分析;内部分析为根据预设权值对目标文献的作者信息分值、研究领域分值、新颖度分值进行加权计算;外部分析为根据预设权值对目标文献的被阅读次数、被引用次数、被发表次数进行加权计算;加权分析为根据预设权值对目标文献的内部分析值、外部分析值进行加权计算;上述权值均支持用户自由设置。
本发明的文献大数据的可视化方法,在步骤4)中,所述个性化文献数据推荐:系统根据索引词、引用网络、参考价值评估等综合数据,基于用户进行个性化文献推荐。
本发明的文献大数据的可视化方法,在步骤4)中,所述个性化文献数据推荐:用户浏览后感兴趣的能够保存到相应的文献列表中,若为用户不感兴趣的,则删除推荐结果中对应的文献。
本发明的文献大数据的可视化方法为用户提供个性化文献数据推荐,有利于用户寻找新的研究思路,从而加快研究进程,提供了便捷、易用、直观、准确的文献大数据可视化方法;立足于信息计量分析领域,并致力于打造提供面向文献大数据的整体数据服务及解决方案;提供文献数据精准化索引;有针对性的对文献进行本体数据展示、引用网络分析、参考价值评估,解决了传统文献数据展示形式单一的痛点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (8)

1.一种文献大数据的可视化方法,其特征在于,包括以下步骤:
1)用户输入检索条件,依据该条件在索引词数据库中检索、生成相匹配的索引词;
2)对步骤1)所述的索引词点选,即可查看相关文献、本体数据及引用网络;
3)对步骤2)所述的文献数据进行可视化的参考价值评估;
4)系统针对用户进行个性化文献数据推荐。
2.根据权利要求1所述的文献大数据的可视化方法,其特征在于,在步骤1)中,所述检索条件默认为第一检索条件,即优选关键词,用户可自主添加次级、三级检索条件。
3.根据权利要求1所述的文献大数据的可视化方法,其特征在于,在步骤1)中,所述检索条件与检索结果存在可视化的关联度分析对比。
4.根据权利要求1所述的文献大数据的可视化方法,其特征在于,在步骤2)中,所述本体数据包括作者信息、研究领域、新颖度、被操作次数,所述新颖度表示目标文献与其他文献的相似度,被操作次数为文献被阅读次数、文献被引用次数、文献被发表次数。
5.根据权利要求1所述的文献大数据的可视化方法,其特征在于,在步骤2)中,所述引用网络包括作者间、论文间引用关系,作者和论文间的著作关系,以及论文间和作者间的引用关系;并通过柱状图、雷达图、热图对一或多个文献数据的本体数据及引用网络进行可视化图表展示。
6.根据权利要求1所述的文献大数据的可视化方法,其特征在于,在步骤3)中,所述参考价值评估包括文献数据内部分析、外部分析及加权分析;内部分析为根据预设权值对目标文献的作者信息分值、研究领域分值、新颖度分值进行加权计算;外部分析为根据预设权值对目标文献的被阅读次数、被引用次数、被发表次数进行加权计算;加权分析为根据预设权值对目标文献的内部分析值、外部分析值进行加权计算;上述权值均支持用户自由设置。
7.根据权利要求1所述的文献大数据的可视化方法,其特征在于,在步骤4)中,所述个性化文献数据推荐:系统根据索引词、引用网络、参考价值评估,基于用户进行个性化文献推荐。
8.根据权利要求1所述的文献大数据的可视化方法,其特征在于,在步骤4)中,所述个性化文献数据推荐:用户浏览后感兴趣的能够保存到相应的文献列表中,若为用户不感兴趣的,则删除推荐结果中对应的文献。
CN201810467348.XA 2018-05-16 2018-05-16 一种文献大数据的可视化方法 Pending CN110502618A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810467348.XA CN110502618A (zh) 2018-05-16 2018-05-16 一种文献大数据的可视化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810467348.XA CN110502618A (zh) 2018-05-16 2018-05-16 一种文献大数据的可视化方法

Publications (1)

Publication Number Publication Date
CN110502618A true CN110502618A (zh) 2019-11-26

Family

ID=68584664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810467348.XA Pending CN110502618A (zh) 2018-05-16 2018-05-16 一种文献大数据的可视化方法

Country Status (1)

Country Link
CN (1) CN110502618A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052411A (zh) * 2020-08-12 2020-12-08 南京航空航天大学 一种基于爬虫的学术搜索结果可视化方案设计方法
CN112990865A (zh) * 2021-03-10 2021-06-18 上海伯俊软件科技有限公司 一种协同工作系统、方法、存储介质及计算机装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040260687A1 (en) * 2003-04-22 2004-12-23 Hiroko Mano Document retrieval apparatus that accentuates retrieval keyword based on feature index
CN105589948A (zh) * 2015-12-18 2016-05-18 重庆邮电大学 一种文献引用网络可视化及文献推荐方法及系统
CN107273431A (zh) * 2017-05-23 2017-10-20 合肥智权信息科技有限公司 一种基于大数据的文献参考价值评估系统和方法
CN107562753A (zh) * 2016-06-30 2018-01-09 索意互动(北京)信息技术有限公司 一种基于索引词的分析方法与装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040260687A1 (en) * 2003-04-22 2004-12-23 Hiroko Mano Document retrieval apparatus that accentuates retrieval keyword based on feature index
CN105589948A (zh) * 2015-12-18 2016-05-18 重庆邮电大学 一种文献引用网络可视化及文献推荐方法及系统
CN107562753A (zh) * 2016-06-30 2018-01-09 索意互动(北京)信息技术有限公司 一种基于索引词的分析方法与装置
CN107273431A (zh) * 2017-05-23 2017-10-20 合肥智权信息科技有限公司 一种基于大数据的文献参考价值评估系统和方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052411A (zh) * 2020-08-12 2020-12-08 南京航空航天大学 一种基于爬虫的学术搜索结果可视化方案设计方法
CN112990865A (zh) * 2021-03-10 2021-06-18 上海伯俊软件科技有限公司 一种协同工作系统、方法、存储介质及计算机装置
CN112990865B (zh) * 2021-03-10 2023-10-31 上海伯俊软件科技有限公司 一种协同工作系统、方法、存储介质及计算机装置

Similar Documents

Publication Publication Date Title
Van der Wal “All quiet on the non-Western front?” A review of public service motivation scholarship in non-Western contexts
Bornmann How are excellent (highly cited) papers defined in bibliometrics? A quantitative analysis of the literature
González‐Valiente et al. A review of altmetrics as an emerging discipline for research evaluation
CN105740366A (zh) 微博用户兴趣推理方法及装置
Sann et al. Predicting online complaining behavior in the hospitality industry: Application of big data analytics to online reviews
Lyu et al. Sentiment analysis using word polarity of social media
CN110502618A (zh) 一种文献大数据的可视化方法
Lubis et al. Topic discovery of online course reviews using LDA with leveraging reviews helpfulness
Venkatasubramanian Applications of qualitative content analysis: Evaluating the reliability and quality of health information websites
Häusner et al. Assessment of metadata quality of the Swedish national bibliography through mapping user awareness
Hong et al. Automatic extraction of new words based on Google News corpora for supporting lexicon-based Chinese word segmentation systems
Ohtani How is People’s Awareness of “Biodiversity” Measured? Using Sentiment Analysis and LDA Topic Modeling in the Twitter Discourse Space from 2010 to 2020
JP2005267095A (ja) 情報表示方法及び装置及び情報表示プログラム
Gao Text analysis of communication faculty publications to identify research trends and interest
Yarbrough et al. Background and history of the joint committee's program evaluation standards
Hashimoto Corpus of Founding Era American English: Designing a Corpus for Interpreting the United States Constitution
McGibbney et al. An intelligent authoring model for subsidiary legislation and regulatory instrument drafting within construction and engineering industry
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치
Jiang et al. Co-word analysis and bibliometric visualization of translation quality literature: research topics and trends in the Chinese mainland (1997–2016)
Arsyah et al. Twitter Sentiment Analysis of Public Space Opinions using SVM and TF-IDF Methods
Lamothe Impact of English-Language and French-language student and faculty populations on the use of online databases in a bilingual Canadian University
von Lünen et al. Hansard at Huddersfield: Adapting Corpus Linguistic Methods for Non-Specialist Use
Elisabeth et al. Discovering scientific collaboration activities using social network analysis. a case study: faculty of computer science universitas Indonesia
De Rosis The online communication of healthcare organisations in the'post-truth'era: An analysis of 167 websites in Italy.
Li et al. Classification of Construction Accident Court Cases Via Natural Language Processing in Hong Kong

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191126