CN108197173A - 一种基于知识图谱的大数据学情分析系统 - Google Patents

一种基于知识图谱的大数据学情分析系统 Download PDF

Info

Publication number
CN108197173A
CN108197173A CN201711387894.4A CN201711387894A CN108197173A CN 108197173 A CN108197173 A CN 108197173A CN 201711387894 A CN201711387894 A CN 201711387894A CN 108197173 A CN108197173 A CN 108197173A
Authority
CN
China
Prior art keywords
module
data
database
knowledge
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711387894.4A
Other languages
English (en)
Inventor
丁娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGZHOU CREATEVIEW OPTOELECTRONICS TECHNOLOGY Co Ltd
Original Assignee
GUANGZHOU CREATEVIEW OPTOELECTRONICS TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU CREATEVIEW OPTOELECTRONICS TECHNOLOGY Co Ltd filed Critical GUANGZHOU CREATEVIEW OPTOELECTRONICS TECHNOLOGY Co Ltd
Priority to CN201711387894.4A priority Critical patent/CN108197173A/zh
Publication of CN108197173A publication Critical patent/CN108197173A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱的大数据学情分析系统,本发明采用证实数据库和假设数据库两种数据库中提取的数据在显示出来的时候是有明显区别的,可以帮助查阅的用户区分,且写入模块可以进行数据库的更新,与时俱进;每个用户对应具有一个子资料库,可以帮助用户在查阅资料的时候随时将资料存入至子资料库,用户也可直接看子资料库中的内容,也可将子资料库中的内容进行拷贝输出,便于知识的散布;相关程度降序模块能够将相关程度最高的资料最先展现,帮助检索人员减少搜索资料的时间;筛选模块将与关键词相关最多的最先展示,筛选模块会将数据按照符合关键词的数量依次递减的顺序进行筛选,能够减少用户检索时间,将最关联的数据进行呈现。

Description

一种基于知识图谱的大数据学情分析系统
技术领域
本发明涉及数据分析领域,具体为一种基于知识图谱的大数据学情分析系统。
背景技术
知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。为学科研究提供切实的、有价值的参考。因此知识图谱对于学习知识来说非常便利,当前,全球网络的发展和普及已经达到空前的规模,人们已经习惯于在互联网上查找各种信息,搜索引擎已成为互联网的中心。
由于将知识图谱引入跨媒体检索系统后,有助于获得各种维度的情境数据,还可以通过进一步推理来发现不同情境下的特征,实现更加准确的用户查询语义分析和检索,因此,开发一种关于知识图谱检索以及分析的平台十分重要,使得用户不但可以搜索出自己想要知道的知识,也可以展示出用户所不知道的但是与其搜索到的相关的知识。
发明内容
本发明的目的在于提供一种基于知识图谱的大数据学情分析系统,以解决上述背景技术中提出的问题。
为了实现上述目的,本发明采用的技术方案为:一种基于知识图谱的大数据学情分析系统,其特征在于:包括知识图谱库,用于存储科学知识;身份认证模块,用于进行身份验证以及查询数据的存储;检索和分析模块,用于检索知识图谱库中的数据,并进行相关或近似数据的分析提取。
作为上述一种优选方式,所述知识图谱库包括证实数据库、假设数据库和写入模块。
作为上述一种优选方式,所述证实数据库和所述假设数据库是两个单独的数据库,所述证实数据库中存储的是被证实的真理、公式、理论;所述假设数据库中存储的是未被证实、存在争议的理论论点等科学知识;所述写入模块用于改写证实数据库和假设数据库内的内容。
通过上述技术方案,两种数据库中提取的数据在显示出来的时候是有明显区别的,可以帮助查阅的用户区分,且写入模块可以进行数据库的更新,与时俱进。
作为上述一种优选方式,所述身份认证模块包括一个身份资料数据库以及一个用户资料存储数据库以及一个增设模块。
作为上述一种优选方式,所述用户资料存储库包括不止一个子资料库,所述一个身份资料数据库存储用于存储各个用户使用的用户名以及其对应的用户密码,其中每个用户名均对应一个子资料库,其中子资料库用于进行用户搜索知识图谱库后进行资料的存储;所述增设模块用于将新增用户的用户名以及密码存入身份资料数据库。
通过上述技术方案,每个用户对应具有一个子资料库,可以帮助用户在查阅资料的时候随时将资料存入至子资料库,用户也可直接看子资料库中的内容,也可将子资料库中的内容进行拷贝输出,便于知识的散布。
作为上述一种优选方式,所述检索和分析模块包括搜索输入模块、检索模块、相关程度降序模块、输出模块。
作为上述一种优选方式,所述搜索输入模块用于输入相关资料关键词或问题;所述检索模块与知识图谱库连接,用于检索出相同词句的知识;所述相关程度降序模块,用于将搜索模块搜索出来的知识根据二者间的相关程度进行降序排列;所述输出模块,用于呈现相关程度降序模块中输出的数据。
通过上述技术方案,相关程度降序模块能够将相关程度最高的资料最先展现,帮助检索人员减少搜索资料的时间。
作为上述一种优选方式,所述检索模块中包含:关键词提取模块,用于将搜索输入模块中输入的语句进行关键词重点降序排列;筛选模块,通过关键词提取模块中降序排列的关键词进行与知识图谱库内的数据进行筛选。
通过上述技术方案,筛选模块将与关键词相关最多的最先展示,例如关键词一共有五个,筛选模块会将数据按照符合五个关键词、符合四个、符合三个依次递减的顺序进行筛选,能够减少用户检索时间,将最关联的数据进行呈现。
作为上述一种优选方式,所述身份认证模块中还包括对比模块,对比模块将输入的密码与身份资料数据库中对应用户名的密码进行对比。
本发明具有以下效益:本方法十分简单,本发明采用证实数据库和假设数据库两种数据库中提取的数据在显示出来的时候是有明显区别的,可以帮助查阅的用户区分,且写入模块可以进行数据库的更新,与时俱进;每个用户对应具有一个子资料库,可以帮助用户在查阅资料的时候随时将资料存入至子资料库,用户也可直接看子资料库中的内容,也可将子资料库中的内容进行拷贝输出,便于知识的散布;相关程度降序模块能够将相关程度最高的资料最先展现,帮助检索人员减少搜索资料的时间;筛选模块将与关键词相关最多的最先展示,例如关键词一共有五个,筛选模块会将数据按照符合五个关键词、符合四个、符合三个依次递减的顺序进行筛选,能够减少用户检索时间,将最关联的数据进行呈现。
附图说明
图1为本发明系统结构示意图。
附图标记:1-知识图谱库;2-身份认证模块;3-检索和分析模块;4-证实数据库;5-假设数据库;6-写入模块;7-身份资料数据库;8-用户资料存储数据库;9-增设模块;10-子资料库;11-搜索输入模块;12-检索模块;13- 相关程度降序模块;14-输出模块;15-关键词提取模块;16-筛选模块;17- 对比模块。
具体实施方式
下面将结合本发明发明实施例中的附图,对本发明发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明发明一部分实施例,而不是全部的实施例。基于本发明发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明发明保护的范围。
本发明采用的技术方案为:一种基于知识图谱的大数据学情分析系统,其特征在于:包括知识图谱库1,用于存储科学知识;身份认证模块2,用于进行身份验证以及查询数据的存储;检索和分析模块3,用于检索知识图谱库 1中的数据,并进行相关或近似数据的分析提取。
作为上述一种优选方式,所述知识图谱库1包括证实数据库4、假设数据库5和写入模块6。
作为上述一种优选方式,所述证实数据库4和所述假设数据库5是两个单独的数据库,所述证实数据库4中存储的是被证实的真理、公式、理论;所述假设数据库5中存储的是未被证实、存在争议的理论论点等科学知识;所述写入模块6用于改写证实数据库4和假设数据库5内的内容。
通过上述技术方案,两种数据库中提取的数据在显示出来的时候是有明显区别的,可以帮助查阅的用户区分,且写入模块6可以进行数据库的更新,与时俱进。
作为上述一种优选方式,所述身份认证模块2包括一个身份资料数据库7 以及一个用户资料存储数据库8以及一个增设模块9。
作为上述一种优选方式,所述用户资料存储库包括不止一个子资料库10,所述一个身份资料数据库7存储用于存储各个用户使用的用户名以及其对应的用户密码,其中每个用户名均对应一个子资料库10,其中子资料库10用于进行用户搜索知识图谱库1后进行资料的存储;所述增设模块9用于将新增用户的用户名以及密码存入身份资料数据库7。
通过上述技术方案,每个用户对应具有一个子资料库10,可以帮助用户在查阅资料的时候随时将资料存入至子资料库10,用户也可直接看子资料库 10中的内容,也可将子资料库10中的内容进行拷贝输出,便于知识的散布。
作为上述一种优选方式,所述检索和分析模块3包括搜索输入模块11、检索模块12、相关程度降序模块13、输出模块14。
作为上述一种优选方式,所述搜索输入模块11用于输入相关资料关键词或问题;所述检索模块12与知识图谱库1连接,用于检索出相同词句的知识;所述相关程度降序模块13,用于将搜索模块搜索出来的知识根据二者间的相关程度进行降序排列;所述输出模块14,用于呈现相关程度降序模块13中输出的数据。
通过上述技术方案,相关程度降序模块13能够将相关程度最高的资料最先展现,帮助检索人员减少搜索资料的时间。
作为上述一种优选方式,所述检索模块12中包含:关键词提取模块15,用于将搜索输入模块11中输入的语句进行关键词重点降序排列;筛选模块16,通过关键词提取模块15中降序排列的关键词进行与知识图谱库1内的数据进行筛选。
通过上述技术方案,筛选模块16将与关键词相关最多的最先展示,例如关键词一共有五个,筛选模块16会将数据按照符合五个关键词、符合四个、符合三个依次递减的顺序进行筛选,能够减少用户检索时间,将最关联的数据进行呈现。
作为上述一种优选方式,所述身份认证模块2中还包括对比模块17,对比模块17将输入的密码与身份资料数据库7中对应用户名的密码进行对比。
本发明在使用的时候,用户首先进行身份验证,如果第一次使用则增设模块9进行新增用户的用户名以及密码的输入,若是老用户,则将输入的密码与身份资料数据库7中的对应用户名的密码进行对比,一致则认证成功,身份认证完成后将进行搜索输入模块11中写入需要搜索的语句,关键词提取模块15将会提取关键词,筛选模块16进行筛选,筛选后的数据将按照相关程度进行排序,相关程度高的最先显示,若用户需要将搜索到的数据进行存储,则可直接存储到每个用户的子资料库10内。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种基于知识图谱的大数据学情分析系统,其特征在于:包括知识图谱库(1),用于存储科学知识;
身份认证模块(2),用于进行身份验证以及查询数据的存储;
检索和分析模块(3),用于检索知识图谱库(1)中的数据,并进行相关或近似数据的分析提取。
2.根据权利要求1所述的一种基于知识图谱的大数据学情分析系统,其特征在于:所述知识图谱库(1)包括证实数据库(4)、假设数据库(5)和写入模块(6)。
3.根据权利要求2所述的一种基于知识图谱的大数据学情分析系统,其特征在于:所述证实数据库(4)和所述假设数据库(5)是两个单独的数据库,所述证实数据库(4)中存储的是被证实的真理、公式、理论;所述假设数据库(5)中存储的是未被证实、存在争议的理论论点的科学知识;所述写入模块(6)用于改写证实数据库(4)和假设数据库(5)内的内容。
4.根据权利要求1所述的一种基于知识图谱的大数据学情分析系统,其特征在于:所述身份认证模块(2)包括一个身份资料数据库(7)以及一个用户资料存储数据库(8)以及一个增设模块(9)。
5.根据权利要求4所述的一种基于知识图谱的大数据学情分析系统,其特征在于:所述用户资料存储库包括不止一个子资料库(10),所述一个身份资料数据库(7)存储用于存储各个用户使用的用户名以及其对应的用户密码,其中每个用户名均对应一个子资料库(10),其中子资料库(10)用于进行用户搜索知识图谱库(1)后进行资料的存储;所述增设模块(9)用于将新增用户的用户名以及密码存入身份资料数据库(7)。
6.根据权利要求1所述的一种基于知识图谱的大数据学情分析系统,其特征在于:所述检索和分析模块(3)包括搜索输入模块(11)、检索模块(12)、相关程度降序模块(13)、输出模块(14)。
7.根据权利要求6所述的一种基于知识图谱的大数据学情分析系统,其特征在于:所述搜索输入模块(11)用于输入相关资料关键词或问题;所述检索模块(12)与知识图谱库(1)连接,用于检索出相同词句的知识;所述相关程度降序模块(13),用于将搜索模块搜索出来的知识根据二者间的相关程度进行降序排列;所述输出模块(14),用于呈现相关程度降序模块(13)中输出的数据。
8.根据权利要求6所述的一种基于知识图谱的大数据学情分析系统,其特征在于:所述检索模块(12)中包含:关键词提取模块(15),用于将搜索输入模块(11)中输入的语句进行关键词重点降序排列;
筛选模块(16),通过关键词提取模块(15)中降序排列的关键词进行与知识图谱库(1)内的数据进行筛选。
9.根据权利要求4所述的一种基于知识图谱的大数据学情分析系统,其特征在于:所述身份认证模块(2)中还包括对比模块(17),对比模块(17)将输入的密码与身份资料数据库(7)中对应用户名的密码进行对比。
CN201711387894.4A 2017-12-20 2017-12-20 一种基于知识图谱的大数据学情分析系统 Pending CN108197173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711387894.4A CN108197173A (zh) 2017-12-20 2017-12-20 一种基于知识图谱的大数据学情分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711387894.4A CN108197173A (zh) 2017-12-20 2017-12-20 一种基于知识图谱的大数据学情分析系统

Publications (1)

Publication Number Publication Date
CN108197173A true CN108197173A (zh) 2018-06-22

Family

ID=62577035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711387894.4A Pending CN108197173A (zh) 2017-12-20 2017-12-20 一种基于知识图谱的大数据学情分析系统

Country Status (1)

Country Link
CN (1) CN108197173A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114817265A (zh) * 2022-04-28 2022-07-29 北京辰行科技有限公司 一种利用大数据服务器的金融信息获取方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120324347A1 (en) * 2011-06-15 2012-12-20 Terrence Monroe Method for parsing, searching and formatting of text input for visual mapping of knowledge information
CN105956052A (zh) * 2016-04-27 2016-09-21 青岛海尔软件有限公司 一种基于垂直领域的知识图谱的构建方法
CN107092639A (zh) * 2017-02-23 2017-08-25 武汉智寻天下科技有限公司 一种搜索引擎系统
CN107180059A (zh) * 2016-03-11 2017-09-19 北大方正集团有限公司 数据检索方法和数据检索系统
CN107341215A (zh) * 2017-06-07 2017-11-10 北京航空航天大学 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120324347A1 (en) * 2011-06-15 2012-12-20 Terrence Monroe Method for parsing, searching and formatting of text input for visual mapping of knowledge information
CN107180059A (zh) * 2016-03-11 2017-09-19 北大方正集团有限公司 数据检索方法和数据检索系统
CN105956052A (zh) * 2016-04-27 2016-09-21 青岛海尔软件有限公司 一种基于垂直领域的知识图谱的构建方法
CN107092639A (zh) * 2017-02-23 2017-08-25 武汉智寻天下科技有限公司 一种搜索引擎系统
CN107341215A (zh) * 2017-06-07 2017-11-10 北京航空航天大学 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曹倩 等: "知识图谱的技术实现流程及相关应用", 《情报理论与实践》 *
朱峰等: "基于知识图谱的未登录词语义研究", 《计算机科学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114817265A (zh) * 2022-04-28 2022-07-29 北京辰行科技有限公司 一种利用大数据服务器的金融信息获取方法
CN114817265B (zh) * 2022-04-28 2023-08-18 深圳市领航财富教育科技有限公司 一种利用大数据服务器的金融信息获取方法

Similar Documents

Publication Publication Date Title
CN104850539B (zh) 一种自然语言理解方法及基于该方法的旅游问答系统
Shah et al. Ontology-driven indexing of public datasets for translational bioinformatics
Lei Zeng et al. Trends and issues in establishing interoperability among knowledge organization systems
CN101566997B (zh) 确定与给定的词集相关的词
Prokopiadou et al. Integrating knowledge management tools for government information
CheshmehSohrabi et al. Using data mining, text mining, and bibliometric techniques to the research trends and gaps in the field of language and linguistics
Zatsman Three-dimensional encoding of emerging meanings in AI-systems
Williamson Using the case study methodology for cadastral reform
Sharma et al. Developing corporate taxonomies for knowledge auditability-a framework for good practices
CN108197173A (zh) 一种基于知识图谱的大数据学情分析系统
JP5988235B1 (ja) 特許文献の検索方法
Tenopir Distribution of citations in databases in a multidisciplinary field
Wang et al. Enabling scientific reproducibility through FAIR data management: An ontology-driven deep learning approach in the NeuroBridge Project
Gaona-García et al. Usability of big data resources in visual search interfaces of repositories based on KOS
Lyal Digitising legacy zoological taxonomic literature: Processes, products and using the output
Almuzara et al. A study of authority control in Spanish university repositories
El-Sherbini Multilingual subject retrieval: Bibliotheca Alexandrina’s subject authority file and linked subject data
Baek et al. A task-centric model for archival metadata schema mapping based on the records lifecycle
Veerappa et al. Syntax and Table Aware Parsing Based Naturalized Structured Query Language.
Stănescu et al. Topic map for medical e-learning
Bohnert Two methods of organizing technical information for search
Thomer et al. Revealing Earth science code and data-use practices using the Throughput Graph Database
Wolfe Natural Language Processing in the Humanities: A Case Study in Automated Metadata Enhancement
Wałek Linking research information within the knowledge portal-the Bridge of Knowledge services for researchers
Hlava et al. Inverting the Library Cataloguing Process to Streamline Technical Services and Significantly Increase Discoverability and Search for Special Collections

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180622

RJ01 Rejection of invention patent application after publication