CN106909606A - 一种基于图谱分析制作学科信息动态框架的方法 - Google Patents

一种基于图谱分析制作学科信息动态框架的方法 Download PDF

Info

Publication number
CN106909606A
CN106909606A CN201710005892.8A CN201710005892A CN106909606A CN 106909606 A CN106909606 A CN 106909606A CN 201710005892 A CN201710005892 A CN 201710005892A CN 106909606 A CN106909606 A CN 106909606A
Authority
CN
China
Prior art keywords
analysis
data
selection
drawn
discipline information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710005892.8A
Other languages
English (en)
Inventor
何晓萍
沈雅云
江毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang University
Original Assignee
Nanchang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang University filed Critical Nanchang University
Priority to CN201710005892.8A priority Critical patent/CN106909606A/zh
Publication of CN106909606A publication Critical patent/CN106909606A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图谱分析制作学科信息动态框架的方法,其方法步骤为:步骤一、选择数据源,命中相关文献;步骤二、数据采集与数据导入准备;步骤三、数据导入,形成可视化图表;步骤四、学科信息动态分析制作。本发明的方法所构成的学科信息动态,具有鲜明的系统性、时效性、准确性等特点,有效地解决了以下由于没有框架规范的学科信息动态分析制作所存在的问题:(1)由于文献来源选择的不妥,而直接影响学科信息动态分析的文献保障;(2)由于缺乏可视化工具导出的客观数据,而造成学科研究的偏向和信息动态的不清;(3)由于没有采用图谱的数据处理,形成对文献代表作归类的随意性,而直接影响学科信息动态分析的质量。

Description

一种基于图谱分析制作学科信息动态框架的方法
技术领域
本发明涉及文献信息处理和图谱分析的相关技术领域,具体涉及一种基于图谱分析制作学科信息动态框架的方法。
背景技术
学科信息动态分析,就是按照科学发展与创新,对文献信息的需求规律,利用综合性或核心合集的数字文献资源,将所在学科最新的各类文献信息(包括:期刊、专利、会议等类型文献)进行检索、分析、梳理、整合,成为本学科的研究新动态和前沿信息,用来指导和支撑研究的理论基础和搭建研究框架。
网络时代信息浩如烟海,作为一名学者,如何快速准确的了解学科研究现状,如何能够做出开题报告;作为一名学科教研者,如何快速准确的了解学科研究的最新进展,如何获取本学科的核心层研究论文,如何在撰写项目申请书时写出课题的独特性和新颖性;要做好上述工作,前提是需要对当前学科信息动态分析的最新信息进行细分和准确的研究。
学科信息动态分析的最新信息,揭示了学科研究的最新主题和发展趋势,为所在学科的教学与科研提供有效信息资源,为学者降低由于“信息迷航”和“认知过载”造成的困扰,提供主动思维的线索,特别有助于论文选题、科研立项、学科教研等基础工作。利用更加科学的分析方法,有利于在细分和准确的研究当前学科信息动态分析的最新信息过程中,提高效率节省时间,便于确定研究方向,提升资料分析的针对性和准确性。
发明内容
针对上述的问题,本发明提出了一种基于图谱分析制作学科信息动态框架的方法,主要利用图谱分析工具,对检索命中的相关研究文献进行可视化分析,从而揭示了研究文献的外表特征和内容特征。其中,外表特征包括:时域、区域分布;发文数量和被引频次排前的作者和机构;被引高频次文献分布;核心期刊分布。内容特征主要是导出了研究文献的聚类图和聚类表,形成学科信息动态分析的具体内容。
本发明采用的技术方案是,一种基于图谱分析制作学科信息动态框架的方法,其特征在于,其方法步骤如下:
步骤一、选择数据源,命中相关文献:选择文献来源的数据库资源,根据研究主题,选择综合性或引文数据库(核心合集库)。国内的数据库,主要有中国知网(CNKI)、中文社会科学引文索引(CSSCI)等;国外的数据库主要有Web of Science平台上的核心合集数据库SCI、SSCI等。制定检索策略,筛选命中相关文献;确定检索词,建立检索式,调整检索策略,筛选命中的相关文献。
步骤二、数据采集与数据导入准备:在综合数据库中,导出筛选后的相关文献的题录格式,保存为txt纯文本格式,再进行数据格式转换;在引文数据库中,导出筛选后的相关文献的“全记录与引用参考文献”,保存为txt纯文本格式。
步骤三、数据导入,形成可视化图表:将步骤二获得的数据导入CiteSpace软件,设置研究的时间尺度为若干年,时间区间设置为1年,再根据分析需要分别选择其中的分析项目、数据抽取对象和路径,具体如下:
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(Term Source),网络节点 (Node Types) 选择作者(Author)、国家(Country)或机构(Institution),设置数据抽取对象阈值,选择算法,运行软件后,形成作者、国家-地区、机构的合作网络图与被引频次和中心度表。
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(TermSource),网络节点 (Node Types)选择被引作者(Cited Author)、被引期刊(CitedJournal),设置数据抽取对象阈值,选择算法,运行软件后,分别形成作者或期刊的共被引分析图、被引频次和中心度表。
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(TermSource)、主题词类型(Term Type),网络节点 (Node Types)选择主题(Term)或关键词(Keyword),设置数据抽取对象阈值,选择算法,运行软件后,分别形成主题或关键词的共现分析图、被引频次和中心度表。再选择引用突现历史(citation burst history),形成关键词突现图。
将数据导入CiteSpace中,根据需要设置时间尺度,选择分析源(Term Source),主题词类型(Term Type),网络节点 (Node Types)选择被引文献(Cited Reference),设置数据抽取对象阈值,选择算法,运行软件后,形成文献共被引分析图、研究热点变迁的图、被引文献的被引频次和中心度表。选择引用突现历史(citation burst history),形成被引文献突现图。在这基础上选择聚类和聚类标签,形成研究热点聚类图和高频词表。
步骤四、学科信息动态分析制作:基于步骤三得到的图谱和表格进一步分析,分成外部特征分析和内部特征分析,展现学科领域的热点与发展趋势及研究内容。其中外部特征的分析,包括时域分布和地域分布、发文数量和被引频次排前的作者分布、被引高频次文献分布、核心期刊分布,清晰地显示了研究热点和研究领域,有助于关注该学科热点研究持续的可行性;内部特征主要包括聚类图表中的被引高频次文献和高频词的描述,有助于学者深入了解该学科的研究热点,开拓研究高峰分化期凸显词的可研空间。将有效的聚类号所对应的高频词综合分析,形成研究热点分析,将其代表作对应的相关论点和论述进行梳理整合,形成学科信息动态分析的具体内容。不同的学者可以综合相关主题的聚类代表作所研究的热点与论述,得出相关研究结论与启示。
本发明的有益效果是:利用本发明的方法所构成的学科信息动态,具有鲜明的系统性、时效性、准确性等特点,有效地解决了以下由于没有框架规范的学科信息动态分析制作所存在的问题:(1)由于文献来源选择的不妥,而直接影响学科信息动态分析的文献保障;(2)由于缺乏可视化工具导出的客观数据,而造成学科研究的偏向和信息动态的不清;(3)由于没有采用图谱的数据处理,形成对文献代表作归类的随意性,而直接影响学科信息动态分析的质量。利用图谱工具构建的信息动态分析方法,使得学科信息动态分析内容更全面、主题更清晰、思路更快捷。
具体实施方式
下面结合具体的实施例对本发明所述的一种基于图谱分析制作学科信息动态框架的方法做进一步说明,但是本发明的保护范围并不限于此。
一种基于图谱分析制作学科信息动态框架的方法,其方法步骤如下:
步骤一、选择数据源,命中相关文献
1.1选择文献来源的数据库资源
根据研究主题,选择综合性或引文数据库(核心合集库)。例如国内的数据库,主要有中国知网(CNKI)、中文社会科学引文索引(CSSCI)等;国外的数据库主要有Web of Science平台上的核心合集数据库SCI、SSCI等。
1.2制定检索策略,筛选命中相关文献;确定检索词,建立检索式,调整检索策略,筛选命中的相关文献。
步骤二、数据采集与数据导入准备
在综合数据库中,导出筛选后的相关文献的题录格式,保存为txt纯文本格式,再进行数据格式转换。
在引文数据库中,导出筛选后的相关文献的“全记录与引用参考文献”,保存为txt纯文本格式。
步骤三、数据导入,形成可视化图表
数据导入CiteSpace,将研究的时间尺度设置为若干年,时间区间设置为1年,再根据分析需要分别选择其中的分析项目、数据抽取对象和路径。
3.1外部特征
3.1.1作者、国家和机构的合作网络图表
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(Term Source),网络节点 (Node Types) 选择作者(Author)、国家(Country)或机构(Institution),设置数据抽取对象阈值,选择算法,运行软件后,形成作者、国家-地区、机构的合作网络图与被引频次和中心度表。
3.1.2作者与期刊的共被引图表
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(Term Source),网络节点 (Node Types)选择被引作者(Cited Author)、被引期刊(Cited Journal),设置数据抽取对象阈值,选择算法,运行软件后,分别形成作者或期刊的共被引分析图、被引频次和中心度表。
3.2内部特征
3.2.1主题、关键词图表
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(Term Source)、主题词类型(Term Type),网络节点 (Node Types)选择主题(Term)或关键词(Keyword),设置数据抽取对象阈值,选择算法,运行软件后,分别形成主题或关键词的共现分析图、被引频次和中心度表。再选择引用突现历史(citation burst history),形成关键词突现图。
3.2.2文献共被引分析图、研究主题迁移图、聚类图与文献被引频次和中心度表
将数据导入CiteSpace中,根据需要设置时间尺度,选择分析源(Term Source),主题词类型(Term Type),网络节点 (Node Types)选择被引文献(Cited Reference),设置数据抽取对象阈值,选择算法,运行软件后,形成文献共被引分析图、研究热点变迁的图、被引文献的被引频次和中心度表。选择引用突现历史(citation burst history),形成被引文献突现图。在这基础上选择聚类和聚类标签,形成研究热点聚类图和高频词表。
步骤四、学科信息动态分析制作:基于对图谱和表格的分析,展现学科领域的热点与发展趋势及研究内容。其中外部特征的分析,包括时域分布和地域分布、发文数量和被引频次排前的作者分布、被引高频次文献分布、核心期刊分布,清晰地显示了研究热点和研究领域,有助于关注该学科热点研究持续的可行性;内部特征主要包括聚类图表中的被引高频次文献和高频词的描述,有助于学者深入了解该学科的研究热点,开拓研究高峰分化期凸显词的可研空间。学科信息动态制作,将有效的聚类号所对应的高频词综合分析,形成研究热点分析,将其代表作对应的相关论点和论述进行梳理整合,形成学科信息动态分析的具体内容。不同的学者可以综合相关主题的聚类代表作所研究的热点与论述,得出相关研究结论与启示。

Claims (1)

1.一种基于图谱分析制作学科信息动态框架的方法,其特征在于,其方法步骤如下:
步骤一、选择数据源,命中相关文献:选择文献来源的数据库资源,根据研究主题,选择综合性或引文数据库;制定检索策略,筛选命中相关文献;确定检索词,建立检索式,调整检索策略,筛选命中的相关文献;
步骤二、数据采集与数据导入准备:在综合数据库中,导出筛选后的相关文献的题录格式,保存为txt纯文本格式,再进行数据格式转换;在引文数据库中,导出筛选后的相关文献的“全记录与引用参考文献”,保存为txt纯文本格式;
步骤三、数据导入,形成可视化图表:将步骤二获得的数据导入CiteSpace软件,设置研究的时间尺度为若干年,时间区间设置为1年,再根据分析需要分别选择其中的分析项目、数据抽取对象和路径,具体如下:
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源,网络节点选择作者、国家或机构,设置数据抽取对象阈值,选择算法,运行软件后,形成作者、国家-地区、机构的合作网络图与被引频次和中心度表;
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源,网络节点选择被引作者、被引期刊,设置数据抽取对象阈值,选择算法,运行软件后,分别形成作者或期刊的共被引分析图、被引频次和中心度表;
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源、主题词类型,网络节点选择主题或关键词,设置数据抽取对象阈值,选择算法,运行软件后,分别形成主题或关键词的共现分析图、被引频次和中心度表;再选择引用突现历史,形成关键词突现图;
将数据导入CiteSpace中,根据需要设置时间尺度,选择分析源,主题词类型,网络节点(Node Types)选择被引文献,设置数据抽取对象阈值,选择算法,运行软件后,形成文献共被引分析图、研究热点变迁的图、被引文献的被引频次和中心度表;选择引用突现历史,形成被引文献突现图;在这基础上选择聚类和聚类标签,形成研究热点聚类图和高频词表;
步骤四、学科信息动态分析制作:基于步骤三得到的图谱和表格进一步分析,分成外部特征分析和内部特征分析,展现学科领域的热点与发展趋势及研究内容;其中外部特征的分析,包括时域分布和地域分布、发文数量和被引频次排前的作者分布、被引高频次文献分布、核心期刊分布,清晰地显示了研究热点和研究领域;内部特征主要包括聚类图表中的被引高频次文献和高频词的描述;将有效的聚类号所对应的高频词综合分析,形成研究热点分析,将其代表作对应的相关论点和论述进行梳理整合,形成学科信息动态分析的具体内容。
CN201710005892.8A 2017-01-05 2017-01-05 一种基于图谱分析制作学科信息动态框架的方法 Pending CN106909606A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710005892.8A CN106909606A (zh) 2017-01-05 2017-01-05 一种基于图谱分析制作学科信息动态框架的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710005892.8A CN106909606A (zh) 2017-01-05 2017-01-05 一种基于图谱分析制作学科信息动态框架的方法

Publications (1)

Publication Number Publication Date
CN106909606A true CN106909606A (zh) 2017-06-30

Family

ID=59206832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710005892.8A Pending CN106909606A (zh) 2017-01-05 2017-01-05 一种基于图谱分析制作学科信息动态框架的方法

Country Status (1)

Country Link
CN (1) CN106909606A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170776A (zh) * 2017-12-26 2018-06-15 北京理工大学 一种绘制绿色技术研究前沿演化路径图的方法及系统
CN110162622A (zh) * 2019-04-02 2019-08-23 浙江工业大学 基于知识图谱的关于智能问答系统的可视化分析方法
CN112069314A (zh) * 2020-08-25 2020-12-11 清华大学 一种基于科技文献数据的特定领域态势分析系统
CN113609303A (zh) * 2021-07-14 2021-11-05 上海电力大学 一种基于知识图谱的国内外电力市场研究热点追踪方法
CN116127086A (zh) * 2022-11-23 2023-05-16 广东省国土资源测绘院 基于科技文献资源的地理科学数据需求分析方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412921A (zh) * 2013-08-12 2013-11-27 同方光盘股份有限公司 文献资源知网节的展示结构
CN104636424A (zh) * 2014-12-02 2015-05-20 南昌大学 一种基于图谱分析构建文献综述框架的方法
US9053179B2 (en) * 2006-04-05 2015-06-09 Lexisnexis, A Division Of Reed Elsevier Inc. Citation network viewer and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9053179B2 (en) * 2006-04-05 2015-06-09 Lexisnexis, A Division Of Reed Elsevier Inc. Citation network viewer and method
CN103412921A (zh) * 2013-08-12 2013-11-27 同方光盘股份有限公司 文献资源知网节的展示结构
CN104636424A (zh) * 2014-12-02 2015-05-20 南昌大学 一种基于图谱分析构建文献综述框架的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李杰: "CiteSpace中文版指南", 《百度URL:CLUSTER.ISCHOOL.DREXEL.EDU/~CCHEN/CITESPACE/MANUAL/CITESPACECHINESE.PDF》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170776A (zh) * 2017-12-26 2018-06-15 北京理工大学 一种绘制绿色技术研究前沿演化路径图的方法及系统
CN110162622A (zh) * 2019-04-02 2019-08-23 浙江工业大学 基于知识图谱的关于智能问答系统的可视化分析方法
CN112069314A (zh) * 2020-08-25 2020-12-11 清华大学 一种基于科技文献数据的特定领域态势分析系统
CN112069314B (zh) * 2020-08-25 2022-05-24 清华大学 一种基于科技文献数据的特定领域态势分析系统
CN113609303A (zh) * 2021-07-14 2021-11-05 上海电力大学 一种基于知识图谱的国内外电力市场研究热点追踪方法
CN116127086A (zh) * 2022-11-23 2023-05-16 广东省国土资源测绘院 基于科技文献资源的地理科学数据需求分析方法及装置
CN116127086B (zh) * 2022-11-23 2023-09-19 广东省国土资源测绘院 基于科技文献资源的地理科学数据需求分析方法及装置

Similar Documents

Publication Publication Date Title
CN106909606A (zh) 一种基于图谱分析制作学科信息动态框架的方法
CN107545791B (zh) 一种利用课件自动生成课堂教学知识图谱的系统和方法
CN106484767A (zh) 一种跨媒体的事件抽取方法
Wu Comparisons of technological innovation capabilities in the solar photovoltaic industries of Taiwan, China, and Korea
CN114117065A (zh) 基于电力生产统计业务的知识图谱构建方法及系统
KR101264899B1 (ko) 기술 및 시장 동향 정보로부터 추출된 유망 사업화 아이템을 표출하는 장치 및 방법
CN103455964A (zh) 一种基于案件信息的案件线索分析系统及方法
Wu et al. Preservation and Transmission Guidelines of Salar Vocal Folk Music.
CN115017251B (zh) 一种用于智慧城市的标准映射地图建立方法及系统
Hamanaka et al. Automatic Generation of Grouping Structure based on the GTTM
Woon et al. A framework for technology forecasting and visualization
Sousa et al. A provenance-based approach to manage long term preservation of scientific data
Kharchuk et al. The Intellectual Structure of Sustainable Leadership Studies: Bibliometric Analysis
Hsieh et al. A bibliometric analysis of the theses and dissertations on information literacy published in the United States and Taiwan
del Río et al. Applied physics in Mexico: mining the past to predict the future
Ingwersen Scientific datasets: informetric characteristics and social utility metrics for biodiversity data sources
Paul et al. Temporal analysis of author ranking using citation-collaboration network
Li et al. Knowledge graph construction for computer networking course group in secondary vocational school based on multi-source heterogeneous data
Nghiem et al. Update on the Development of Educational Research in Vietnam until 2023: A Bibliometrics Analysis using Web of Science Database
Szostak et al. Comparative Approaches to Interdisciplinary KOSs: Use Cases of Converting UDC to BCC
Cruz-Cárdenas et al. Smartphones and higher education: mapping the field
CN104699829A (zh) 一种原子词知识检索的方法
Sikacz Sustainable development issues in scientific publications
Sakata Knowledge Structuring Tools for Decision Support Service: An Overview of Citation-Based Approach
Wanda et al. Mapping the Library Contribution to Knowledge Management: A Bibliometric Approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170630