CN106909606A - 一种基于图谱分析制作学科信息动态框架的方法 - Google Patents
一种基于图谱分析制作学科信息动态框架的方法 Download PDFInfo
- Publication number
- CN106909606A CN106909606A CN201710005892.8A CN201710005892A CN106909606A CN 106909606 A CN106909606 A CN 106909606A CN 201710005892 A CN201710005892 A CN 201710005892A CN 106909606 A CN106909606 A CN 106909606A
- Authority
- CN
- China
- Prior art keywords
- analysis
- data
- selection
- drawn
- discipline information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于图谱分析制作学科信息动态框架的方法,其方法步骤为:步骤一、选择数据源,命中相关文献;步骤二、数据采集与数据导入准备;步骤三、数据导入,形成可视化图表;步骤四、学科信息动态分析制作。本发明的方法所构成的学科信息动态,具有鲜明的系统性、时效性、准确性等特点,有效地解决了以下由于没有框架规范的学科信息动态分析制作所存在的问题:(1)由于文献来源选择的不妥,而直接影响学科信息动态分析的文献保障;(2)由于缺乏可视化工具导出的客观数据,而造成学科研究的偏向和信息动态的不清;(3)由于没有采用图谱的数据处理,形成对文献代表作归类的随意性,而直接影响学科信息动态分析的质量。
Description
技术领域
本发明涉及文献信息处理和图谱分析的相关技术领域,具体涉及一种基于图谱分析制作学科信息动态框架的方法。
背景技术
学科信息动态分析,就是按照科学发展与创新,对文献信息的需求规律,利用综合性或核心合集的数字文献资源,将所在学科最新的各类文献信息(包括:期刊、专利、会议等类型文献)进行检索、分析、梳理、整合,成为本学科的研究新动态和前沿信息,用来指导和支撑研究的理论基础和搭建研究框架。
网络时代信息浩如烟海,作为一名学者,如何快速准确的了解学科研究现状,如何能够做出开题报告;作为一名学科教研者,如何快速准确的了解学科研究的最新进展,如何获取本学科的核心层研究论文,如何在撰写项目申请书时写出课题的独特性和新颖性;要做好上述工作,前提是需要对当前学科信息动态分析的最新信息进行细分和准确的研究。
学科信息动态分析的最新信息,揭示了学科研究的最新主题和发展趋势,为所在学科的教学与科研提供有效信息资源,为学者降低由于“信息迷航”和“认知过载”造成的困扰,提供主动思维的线索,特别有助于论文选题、科研立项、学科教研等基础工作。利用更加科学的分析方法,有利于在细分和准确的研究当前学科信息动态分析的最新信息过程中,提高效率节省时间,便于确定研究方向,提升资料分析的针对性和准确性。
发明内容
针对上述的问题,本发明提出了一种基于图谱分析制作学科信息动态框架的方法,主要利用图谱分析工具,对检索命中的相关研究文献进行可视化分析,从而揭示了研究文献的外表特征和内容特征。其中,外表特征包括:时域、区域分布;发文数量和被引频次排前的作者和机构;被引高频次文献分布;核心期刊分布。内容特征主要是导出了研究文献的聚类图和聚类表,形成学科信息动态分析的具体内容。
本发明采用的技术方案是,一种基于图谱分析制作学科信息动态框架的方法,其特征在于,其方法步骤如下:
步骤一、选择数据源,命中相关文献:选择文献来源的数据库资源,根据研究主题,选择综合性或引文数据库(核心合集库)。国内的数据库,主要有中国知网(CNKI)、中文社会科学引文索引(CSSCI)等;国外的数据库主要有Web of Science平台上的核心合集数据库SCI、SSCI等。制定检索策略,筛选命中相关文献;确定检索词,建立检索式,调整检索策略,筛选命中的相关文献。
步骤二、数据采集与数据导入准备:在综合数据库中,导出筛选后的相关文献的题录格式,保存为txt纯文本格式,再进行数据格式转换;在引文数据库中,导出筛选后的相关文献的“全记录与引用参考文献”,保存为txt纯文本格式。
步骤三、数据导入,形成可视化图表:将步骤二获得的数据导入CiteSpace软件,设置研究的时间尺度为若干年,时间区间设置为1年,再根据分析需要分别选择其中的分析项目、数据抽取对象和路径,具体如下:
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(Term Source),网络节点 (Node Types) 选择作者(Author)、国家(Country)或机构(Institution),设置数据抽取对象阈值,选择算法,运行软件后,形成作者、国家-地区、机构的合作网络图与被引频次和中心度表。
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(TermSource),网络节点 (Node Types)选择被引作者(Cited Author)、被引期刊(CitedJournal),设置数据抽取对象阈值,选择算法,运行软件后,分别形成作者或期刊的共被引分析图、被引频次和中心度表。
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(TermSource)、主题词类型(Term Type),网络节点 (Node Types)选择主题(Term)或关键词(Keyword),设置数据抽取对象阈值,选择算法,运行软件后,分别形成主题或关键词的共现分析图、被引频次和中心度表。再选择引用突现历史(citation burst history),形成关键词突现图。
将数据导入CiteSpace中,根据需要设置时间尺度,选择分析源(Term Source),主题词类型(Term Type),网络节点 (Node Types)选择被引文献(Cited Reference),设置数据抽取对象阈值,选择算法,运行软件后,形成文献共被引分析图、研究热点变迁的图、被引文献的被引频次和中心度表。选择引用突现历史(citation burst history),形成被引文献突现图。在这基础上选择聚类和聚类标签,形成研究热点聚类图和高频词表。
步骤四、学科信息动态分析制作:基于步骤三得到的图谱和表格进一步分析,分成外部特征分析和内部特征分析,展现学科领域的热点与发展趋势及研究内容。其中外部特征的分析,包括时域分布和地域分布、发文数量和被引频次排前的作者分布、被引高频次文献分布、核心期刊分布,清晰地显示了研究热点和研究领域,有助于关注该学科热点研究持续的可行性;内部特征主要包括聚类图表中的被引高频次文献和高频词的描述,有助于学者深入了解该学科的研究热点,开拓研究高峰分化期凸显词的可研空间。将有效的聚类号所对应的高频词综合分析,形成研究热点分析,将其代表作对应的相关论点和论述进行梳理整合,形成学科信息动态分析的具体内容。不同的学者可以综合相关主题的聚类代表作所研究的热点与论述,得出相关研究结论与启示。
本发明的有益效果是:利用本发明的方法所构成的学科信息动态,具有鲜明的系统性、时效性、准确性等特点,有效地解决了以下由于没有框架规范的学科信息动态分析制作所存在的问题:(1)由于文献来源选择的不妥,而直接影响学科信息动态分析的文献保障;(2)由于缺乏可视化工具导出的客观数据,而造成学科研究的偏向和信息动态的不清;(3)由于没有采用图谱的数据处理,形成对文献代表作归类的随意性,而直接影响学科信息动态分析的质量。利用图谱工具构建的信息动态分析方法,使得学科信息动态分析内容更全面、主题更清晰、思路更快捷。
具体实施方式
下面结合具体的实施例对本发明所述的一种基于图谱分析制作学科信息动态框架的方法做进一步说明,但是本发明的保护范围并不限于此。
一种基于图谱分析制作学科信息动态框架的方法,其方法步骤如下:
步骤一、选择数据源,命中相关文献
1.1选择文献来源的数据库资源
根据研究主题,选择综合性或引文数据库(核心合集库)。例如国内的数据库,主要有中国知网(CNKI)、中文社会科学引文索引(CSSCI)等;国外的数据库主要有Web of Science平台上的核心合集数据库SCI、SSCI等。
1.2制定检索策略,筛选命中相关文献;确定检索词,建立检索式,调整检索策略,筛选命中的相关文献。
步骤二、数据采集与数据导入准备
在综合数据库中,导出筛选后的相关文献的题录格式,保存为txt纯文本格式,再进行数据格式转换。
在引文数据库中,导出筛选后的相关文献的“全记录与引用参考文献”,保存为txt纯文本格式。
步骤三、数据导入,形成可视化图表
数据导入CiteSpace,将研究的时间尺度设置为若干年,时间区间设置为1年,再根据分析需要分别选择其中的分析项目、数据抽取对象和路径。
3.1外部特征
3.1.1作者、国家和机构的合作网络图表
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(Term Source),网络节点 (Node Types) 选择作者(Author)、国家(Country)或机构(Institution),设置数据抽取对象阈值,选择算法,运行软件后,形成作者、国家-地区、机构的合作网络图与被引频次和中心度表。
3.1.2作者与期刊的共被引图表
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(Term Source),网络节点 (Node Types)选择被引作者(Cited Author)、被引期刊(Cited Journal),设置数据抽取对象阈值,选择算法,运行软件后,分别形成作者或期刊的共被引分析图、被引频次和中心度表。
3.2内部特征
3.2.1主题、关键词图表
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源(Term Source)、主题词类型(Term Type),网络节点 (Node Types)选择主题(Term)或关键词(Keyword),设置数据抽取对象阈值,选择算法,运行软件后,分别形成主题或关键词的共现分析图、被引频次和中心度表。再选择引用突现历史(citation burst history),形成关键词突现图。
3.2.2文献共被引分析图、研究主题迁移图、聚类图与文献被引频次和中心度表
将数据导入CiteSpace中,根据需要设置时间尺度,选择分析源(Term Source),主题词类型(Term Type),网络节点 (Node Types)选择被引文献(Cited Reference),设置数据抽取对象阈值,选择算法,运行软件后,形成文献共被引分析图、研究热点变迁的图、被引文献的被引频次和中心度表。选择引用突现历史(citation burst history),形成被引文献突现图。在这基础上选择聚类和聚类标签,形成研究热点聚类图和高频词表。
步骤四、学科信息动态分析制作:基于对图谱和表格的分析,展现学科领域的热点与发展趋势及研究内容。其中外部特征的分析,包括时域分布和地域分布、发文数量和被引频次排前的作者分布、被引高频次文献分布、核心期刊分布,清晰地显示了研究热点和研究领域,有助于关注该学科热点研究持续的可行性;内部特征主要包括聚类图表中的被引高频次文献和高频词的描述,有助于学者深入了解该学科的研究热点,开拓研究高峰分化期凸显词的可研空间。学科信息动态制作,将有效的聚类号所对应的高频词综合分析,形成研究热点分析,将其代表作对应的相关论点和论述进行梳理整合,形成学科信息动态分析的具体内容。不同的学者可以综合相关主题的聚类代表作所研究的热点与论述,得出相关研究结论与启示。
Claims (1)
1.一种基于图谱分析制作学科信息动态框架的方法,其特征在于,其方法步骤如下:
步骤一、选择数据源,命中相关文献:选择文献来源的数据库资源,根据研究主题,选择综合性或引文数据库;制定检索策略,筛选命中相关文献;确定检索词,建立检索式,调整检索策略,筛选命中的相关文献;
步骤二、数据采集与数据导入准备:在综合数据库中,导出筛选后的相关文献的题录格式,保存为txt纯文本格式,再进行数据格式转换;在引文数据库中,导出筛选后的相关文献的“全记录与引用参考文献”,保存为txt纯文本格式;
步骤三、数据导入,形成可视化图表:将步骤二获得的数据导入CiteSpace软件,设置研究的时间尺度为若干年,时间区间设置为1年,再根据分析需要分别选择其中的分析项目、数据抽取对象和路径,具体如下:
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源,网络节点选择作者、国家或机构,设置数据抽取对象阈值,选择算法,运行软件后,形成作者、国家-地区、机构的合作网络图与被引频次和中心度表;
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源,网络节点选择被引作者、被引期刊,设置数据抽取对象阈值,选择算法,运行软件后,分别形成作者或期刊的共被引分析图、被引频次和中心度表;
将数据导入CiteSpace中,根据需要设置时间尺度,选择主题词来源、主题词类型,网络节点选择主题或关键词,设置数据抽取对象阈值,选择算法,运行软件后,分别形成主题或关键词的共现分析图、被引频次和中心度表;再选择引用突现历史,形成关键词突现图;
将数据导入CiteSpace中,根据需要设置时间尺度,选择分析源,主题词类型,网络节点(Node Types)选择被引文献,设置数据抽取对象阈值,选择算法,运行软件后,形成文献共被引分析图、研究热点变迁的图、被引文献的被引频次和中心度表;选择引用突现历史,形成被引文献突现图;在这基础上选择聚类和聚类标签,形成研究热点聚类图和高频词表;
步骤四、学科信息动态分析制作:基于步骤三得到的图谱和表格进一步分析,分成外部特征分析和内部特征分析,展现学科领域的热点与发展趋势及研究内容;其中外部特征的分析,包括时域分布和地域分布、发文数量和被引频次排前的作者分布、被引高频次文献分布、核心期刊分布,清晰地显示了研究热点和研究领域;内部特征主要包括聚类图表中的被引高频次文献和高频词的描述;将有效的聚类号所对应的高频词综合分析,形成研究热点分析,将其代表作对应的相关论点和论述进行梳理整合,形成学科信息动态分析的具体内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710005892.8A CN106909606A (zh) | 2017-01-05 | 2017-01-05 | 一种基于图谱分析制作学科信息动态框架的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710005892.8A CN106909606A (zh) | 2017-01-05 | 2017-01-05 | 一种基于图谱分析制作学科信息动态框架的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106909606A true CN106909606A (zh) | 2017-06-30 |
Family
ID=59206832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710005892.8A Pending CN106909606A (zh) | 2017-01-05 | 2017-01-05 | 一种基于图谱分析制作学科信息动态框架的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106909606A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108170776A (zh) * | 2017-12-26 | 2018-06-15 | 北京理工大学 | 一种绘制绿色技术研究前沿演化路径图的方法及系统 |
CN110162622A (zh) * | 2019-04-02 | 2019-08-23 | 浙江工业大学 | 基于知识图谱的关于智能问答系统的可视化分析方法 |
CN112069314A (zh) * | 2020-08-25 | 2020-12-11 | 清华大学 | 一种基于科技文献数据的特定领域态势分析系统 |
CN113609303A (zh) * | 2021-07-14 | 2021-11-05 | 上海电力大学 | 一种基于知识图谱的国内外电力市场研究热点追踪方法 |
CN116127086A (zh) * | 2022-11-23 | 2023-05-16 | 广东省国土资源测绘院 | 基于科技文献资源的地理科学数据需求分析方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412921A (zh) * | 2013-08-12 | 2013-11-27 | 同方光盘股份有限公司 | 文献资源知网节的展示结构 |
CN104636424A (zh) * | 2014-12-02 | 2015-05-20 | 南昌大学 | 一种基于图谱分析构建文献综述框架的方法 |
US9053179B2 (en) * | 2006-04-05 | 2015-06-09 | Lexisnexis, A Division Of Reed Elsevier Inc. | Citation network viewer and method |
-
2017
- 2017-01-05 CN CN201710005892.8A patent/CN106909606A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9053179B2 (en) * | 2006-04-05 | 2015-06-09 | Lexisnexis, A Division Of Reed Elsevier Inc. | Citation network viewer and method |
CN103412921A (zh) * | 2013-08-12 | 2013-11-27 | 同方光盘股份有限公司 | 文献资源知网节的展示结构 |
CN104636424A (zh) * | 2014-12-02 | 2015-05-20 | 南昌大学 | 一种基于图谱分析构建文献综述框架的方法 |
Non-Patent Citations (1)
Title |
---|
李杰: "CiteSpace中文版指南", 《百度URL:CLUSTER.ISCHOOL.DREXEL.EDU/~CCHEN/CITESPACE/MANUAL/CITESPACECHINESE.PDF》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108170776A (zh) * | 2017-12-26 | 2018-06-15 | 北京理工大学 | 一种绘制绿色技术研究前沿演化路径图的方法及系统 |
CN110162622A (zh) * | 2019-04-02 | 2019-08-23 | 浙江工业大学 | 基于知识图谱的关于智能问答系统的可视化分析方法 |
CN112069314A (zh) * | 2020-08-25 | 2020-12-11 | 清华大学 | 一种基于科技文献数据的特定领域态势分析系统 |
CN112069314B (zh) * | 2020-08-25 | 2022-05-24 | 清华大学 | 一种基于科技文献数据的特定领域态势分析系统 |
CN113609303A (zh) * | 2021-07-14 | 2021-11-05 | 上海电力大学 | 一种基于知识图谱的国内外电力市场研究热点追踪方法 |
CN116127086A (zh) * | 2022-11-23 | 2023-05-16 | 广东省国土资源测绘院 | 基于科技文献资源的地理科学数据需求分析方法及装置 |
CN116127086B (zh) * | 2022-11-23 | 2023-09-19 | 广东省国土资源测绘院 | 基于科技文献资源的地理科学数据需求分析方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106909606A (zh) | 一种基于图谱分析制作学科信息动态框架的方法 | |
CN107545791B (zh) | 一种利用课件自动生成课堂教学知识图谱的系统和方法 | |
CN106484767A (zh) | 一种跨媒体的事件抽取方法 | |
Wu | Comparisons of technological innovation capabilities in the solar photovoltaic industries of Taiwan, China, and Korea | |
CN114117065A (zh) | 基于电力生产统计业务的知识图谱构建方法及系统 | |
KR101264899B1 (ko) | 기술 및 시장 동향 정보로부터 추출된 유망 사업화 아이템을 표출하는 장치 및 방법 | |
CN103455964A (zh) | 一种基于案件信息的案件线索分析系统及方法 | |
Wu et al. | Preservation and Transmission Guidelines of Salar Vocal Folk Music. | |
CN115017251B (zh) | 一种用于智慧城市的标准映射地图建立方法及系统 | |
Hamanaka et al. | Automatic Generation of Grouping Structure based on the GTTM | |
Woon et al. | A framework for technology forecasting and visualization | |
Sousa et al. | A provenance-based approach to manage long term preservation of scientific data | |
Kharchuk et al. | The Intellectual Structure of Sustainable Leadership Studies: Bibliometric Analysis | |
Hsieh et al. | A bibliometric analysis of the theses and dissertations on information literacy published in the United States and Taiwan | |
del Río et al. | Applied physics in Mexico: mining the past to predict the future | |
Ingwersen | Scientific datasets: informetric characteristics and social utility metrics for biodiversity data sources | |
Paul et al. | Temporal analysis of author ranking using citation-collaboration network | |
Li et al. | Knowledge graph construction for computer networking course group in secondary vocational school based on multi-source heterogeneous data | |
Nghiem et al. | Update on the Development of Educational Research in Vietnam until 2023: A Bibliometrics Analysis using Web of Science Database | |
Szostak et al. | Comparative Approaches to Interdisciplinary KOSs: Use Cases of Converting UDC to BCC | |
Cruz-Cárdenas et al. | Smartphones and higher education: mapping the field | |
CN104699829A (zh) | 一种原子词知识检索的方法 | |
Sikacz | Sustainable development issues in scientific publications | |
Sakata | Knowledge Structuring Tools for Decision Support Service: An Overview of Citation-Based Approach | |
Wanda et al. | Mapping the Library Contribution to Knowledge Management: A Bibliometric Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170630 |