CN110633364A - 基于图数据库的食品安全知识图谱构建方法和展示模式 - Google Patents
基于图数据库的食品安全知识图谱构建方法和展示模式 Download PDFInfo
- Publication number
- CN110633364A CN110633364A CN201910898334.8A CN201910898334A CN110633364A CN 110633364 A CN110633364 A CN 110633364A CN 201910898334 A CN201910898334 A CN 201910898334A CN 110633364 A CN110633364 A CN 110633364A
- Authority
- CN
- China
- Prior art keywords
- food safety
- database
- knowledge
- graph
- display mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000013305 food Nutrition 0.000 title claims abstract description 160
- 238000010276 construction Methods 0.000 title claims description 26
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims description 16
- 238000005516 engineering process Methods 0.000 claims description 10
- 238000012800 visualization Methods 0.000 claims description 5
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 3
- 230000002427 irreversible effect Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 2
- 230000004048 modification Effects 0.000 claims description 2
- 238000013523 data management Methods 0.000 abstract description 2
- 231100000279 safety data Toxicity 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 235000013336 milk Nutrition 0.000 description 7
- 239000008267 milk Substances 0.000 description 7
- 210000004080 milk Anatomy 0.000 description 7
- 235000021393 food security Nutrition 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 239000007788 liquid Substances 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 235000013365 dairy product Nutrition 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 230000035764 nutrition Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 235000013618 yogurt Nutrition 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 238000009411 base construction Methods 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000447 pesticide residue Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000273 veterinary drug Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了基于图数据库的食品安全知识图谱构建方法和展示模式。方法为:从不同数据源获取食品安全原始数据;利用开源的词法工具和食品安全词典进行命名实体识别;关系抽取获得食品安全实体之间的关系;构建食品安全知识图谱,将其存储在Neo4j数据库;根据需求设计食品安全领域的动态知识展示模式;启动Neo4j数据库服务,修改Django平台数据库配置文件;将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。本发明将Neo4j数据库与Django平台进行集成,实现食品安全领域构建食品安全知识图谱,动态重组知识图谱展示模式,提升食品安全领域数据管理效率以及使用的灵活性。
Description
技术领域
本发明涉及数据库处理技术和计算机技术领域,具体涉及基于图数据库的食品安全知识图谱构建方法和展示模式。
背景技术
Neo4j是一个高性能的非关系型图形数据库。Neo4j使用图相关的概念来描述数据模型,把数据保存为图中的节点以及节点之间的关系。很多应用中数据之间的关系,可以很直接地使用图中节点和关系的概念来建模。对于这样的应用,使用Neo4j来存储数据会非常的自然,要优于使用关系型数据库。
Neo4j使用“图”这种最通用的数据结构来对数据进行建模使得Neo4j的数据模型在表达能力上非常强。链表、树和散列表等数据结构都可以抽象成用图来表示。Neo4j同时具有一般数据库的基本特性,包括事务支持、高可用性和高性能等。Neo4j已经在很多生产环境中得到了应用。流行的云应用开发平台Heroku也提供了Neo4j作为可选的扩展。
Django是一个高级的Python web开发平台框架,它鼓励快速开发和干净、实用的设计。它由经验丰富的开发人员构建,可以解决Web开发的许多麻烦,而且是免费和开源的。
知识图谱本质上是一种叫做语义网络的知识库,即具有有向图结构的一个知识库,其中图的节点代表实例或者概念,而图的边代表实例/概念之间的各种语义关系。知识图谱的出现,为人们提供了一种更好地组织、管理和理解海量信息的方法,同时,也成为知识检索、智能问答、个性化推荐等应用的基础。目前尚未有成熟的食品安全知识图谱构建方式。
食品安全领域所涉及的食品安全问题面广而且复杂,该领域涉及食品对象本身,也会涉及该食品所属类别,即它的物理性质、化学性质。在加工食品的过程中仍然包含食品工程的加工工艺与技术,而保证食品安全远远不止这些,食品可能为动、植物原料,在种植和养殖过程中,会受到环境污染,还可能受到农药残留,兽药残留污染,添加剂超标和食源性微生物污染,在加工过程中,可能会微生物污染,所以会引发多种食品安全事件,而一旦发生食品安全事件,就会获取该事件的各种信息比如事件发生的时间、地点、事件规模、事件原因、事件损失程度、涉及企业与负责人以及涉及的产品等等。
因此,构建一个完整的食品安全领域的知识图谱是很困难的。首先领域知识组织结构复杂,其次有些领域知识可以直接建立知识图谱,而有些领域知识结构不明显,无法直接构建,还需利用模型、算法支持构建,再就是对问题的知识表示,都是从需求而来,不需要都全部展示。
发明内容
有鉴于此,本发明提供了基于图数据库的食品安全知识图谱构建方法和展示模式,通过将Neo4j数据库与Django平台进行集成,较简单地存储了知识图谱并可以灵活配置,按需求动态重组知识图谱展示模式。
本发明提供了基于图数据库的食品安全知识图谱构建方法和展示模式,所述方法包括:
从不同数据源获取大量食品安全原始数据;利用开源的词法工具和食品安全词典进行命名实体识别;关系抽取获得食品安全实体之间的关系;根据需求设计食品安全领域的动态知识展示模式;构建食品安全知识图谱,并将其存储在Neo4j数据库中;启动Neo4j数据库服务,修改Django平台数据库配置文件;将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。
其中所述从不同数据源获取大量食品安全原始数据包括:结构化的食品安全数据和半结构化食品安全数据。结构化食品安全数据大多来自于网络上百科信息和食品网站规则数据,半结构化食品安全数据则来自于食品安全学这类电子文档。
优选地,所述从不同数据源获取大量食品安全原始数据步骤包括:对网页结构化数据进行页面解析,基于需要的内容设定解析规则,获取食品安全知识实体,及其分类信息;对食品安全学这类电子文档,利用已建立的关键实体抽取规则,获取相应的实体。
优选地,所述利用开源的词法工具和食品安全词典进行命名实体识别包括:利用预设的词法工具,根据食品安全领域的特点,利用食品安全词典库,进行命名实体识别。
优选地,所述关系抽取获得食品安全实体之间的关系步骤包括:对所得的食品安全领域知识进行解析,得到语义信息,利用已建立的食品安全关系提取模型,抽取实体之间的关系。
优选地,所述根据需求设计食品安全领域的动态知识展示模式包括:依据需求,重组知识图谱的展示与组织。首先,依据需求划分食品安全领域知识图谱的知识域,在多问题域中划分为不可再分的独立于,再以不可再分的独立域,构建各子知识图谱。其次,依据不同需求,重组知识图谱。
优选地,所述构建食品安全知识图谱,并将其存储在Neo4j数据库中步骤包括:将上述食品安全领域的实体,以及实体之间的关联关系,以csv格式导入Neo4j数据库中。
优选地,所述启动Neo4j数据库服务,修改Django平台数据库配置文件包括:启动Neo4j数据库服务,对所述Neo4j数据库的数据信息:所述Neo4j数据库连接信息、用户名、密码、sql语句模板进行修改配置。
优选地,所述将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层包括:
自动读取所述配置文件,将所述Neo4j数据库与所述Django平台连接;将cypher语句执行的结果返回的数据转换成前端展示所需要的JSON格式;利用可视化技术将存储的知识图谱以知识树,图谱等多种形式展示。
基于图数据库的食品安全知识图谱构建方法和展示模式,包括:
获取模块,从不同数据源获取大量食品安全原始数据;
识别模块,利用开源的词法工具和食品安全词典进行命名实体识别;
抽取模块,用于关系抽取获得食品安全实体之间的关系;
重组模块,用于根据需求设计食品安全领域的动态知识展示模式;
存储模块,用于将上述食品安全知识图谱存储在Neo4j数据库中;
配置模块,用于启动Neo4j数据库服务,并且修改Django平台数据库配置文件;
展示模块,用于将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。
优选地,所述获取模块还包括:
获取其他非结构化食品安全领域知识。
优选地,所述识别模块具体用于:
根据已有的开源词法分析工具,加载食品安全领域词典,进行命名实体识别,获取更多实体概念。
优选地,所述抽取模块具体用于:
利用已有的关系抽取模型,对食品安全实体进行关系提取。
优选地,所述重组模块具体用于:
根据需求设计食品安全领域的动态知识展示模式,依据需求,重组知识图谱的展示与组织。
优选地,所述存储模块具体用于:
将上述食品安全领域的实体,以及实体之间的关联关系,以csv格式导入Neo4j数据库中。
优选地,所述配置模块具体包括:
配置Neo4j数据库的数据信息包括:所述Neo4j数据库连接信息、用户名、密码、sql语句模块。
优选地,所述展示模块具体包括:
连接Neo4j与Django平台;将cypher语句执行的结果返回的数据转换成前端展示所需要的JSON格式;前端利用可视化技术,将存储的知识图谱以知识树,图谱等多种形式展示。
从上述技术方案可以看出,本发明提供了基于图数据库的食品安全知识图谱构建方法和展示模式。首先从不同数据源获取大量食品安全原始数据,然后利用开源的词法工具和词典进行命名实体识别,然后关系抽取获得食品安全实体之间的关系,然后根据需求设计食品安全领域的动态知识展示模式,然后构建食品安全知识图谱,并将其存储在Neo4j数据库中,最后启动Neo4j数据库服务,修改Django平台数据库配置文件,将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。
附图说明
图1为本发明公开的基于图数据库的食品安全知识图谱构建方法和展示模式的结构示意图;
图2为本发明公开的基于图数据库的食品安全知识图谱构建方法和展示模式的功能模块图;
图3为本发明公开的基于图数据库的食品安全知识图谱构建方法和展示模式的酸奶制作工艺实例图;
图4为本发明公开的基于图数据库的食品安全知识图谱构建方法和展示模式的食品知识实例图;
图5为本发明公开的基于图数据库的食品安全知识图谱构建方法和展示模式的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,为本发明公开的基于图数据库的食品安全知识图谱构建方法和展示模式的结构示意图。
所述食品安全知识图谱结构100包括Neo4j数据库10、Web页面20、Django平台30。食品安全知识图谱就是利用Neo4j的数据库,基于Django平台搭建的在前端Web页面可展示知识图谱。
所述Neo4j数据库10可以包含在实现上述食品安全知识图谱构建方法实例中的步骤中,如图4所示的步骤S104~S106。
所述Web页面20可以包含在实现上述食品安全知识图谱构建方法实例中的步骤中,如图4所示的步骤S106。
所述Django平台30可以包含在实现上述食品安全知识图谱构建方法实例中的步骤中,如图4所示的步骤S101~S106。
在所示的示意图中,Neo4j数据库作为存储知识图谱的数据库,与Django平台进行连接,而前端Web页面的展示也是与Django平台前端代码相连接。
如图2所示,为本发明公开的的基于图数据库的食品安全知识图谱构建方法和展示模式的功能模块图,所述方法可以包括以下步骤:
所述获取模块201,从不同数据源获取食品安全原始数据。
食品安全数据主要包括:半结构化的食品安全数据和非结构化食品安全数据。半结构化食品安全数据大多来自于网络上百科信息和食品网站规则数据,非结构化食品安全数据则来自于食品安全学这类电子文档。在所述获取模块201中,获取食品安全原始数据包括但不限于通过网络爬虫技术、访问已有的行业报告、公开的食品安全数据集、食品安全相关的权威电子书籍。
所述识别模块202,利用开源的词法工具和食品安全词典进行命名实体识别。
利用预设的词法工具,根据食品安全领域的特点,并利用该词典库,进行命名实体识别。
举例而言,所述识别模块202利用Thulac中文词法分析工具包对所述语料库中的语料进行分词与词性标注处理,当识别为命名实体的,通过预设标注标注出来,当识别为非命名实体的,不进行标注。
所述抽取模块203,关系抽取获得食品安全实体之间的关系。
对所得的食品安全领域知识进行解析,得到语义信息,利用已建立的食品安全关系提取模型,抽取实体之间的关系。
在实施方式中,可以采用远程监督的方式来获取用于训练所述关系提取模型的训练样本数据,比如可以将已有的知识对应到非结构化语料中,从而生成大量的训练样本数据,然后基于训练样本数据及机器学习算法来训练得到所述关系提取模型。该些知识的来源可以是人工标注、现有的知识库或特定的语句结构。
所述重组模块204,用于根据需求设计食品安全领域的动态知识展示模式。
根据需求不同,重组知识图谱,有以下三种不同情形:由于需求不同问题域,或主要表示问题的中心不同,会出现原来的知识实体头变为知识实体为,这按一般知识抽取关系出现了逆向关系;由于问题的大小不同,需要表达的知识关系不会是最原始,一层不变的关系;由于需求的复杂性,原来的子知识图谱与新需求不能完全匹配的问题。
传统的知识图谱表示形式以(头实体,关系,尾实体)的三元组表示形式,均以多种链接的形式进行表示,将知识表示成了无限大的一张图,是实际应用中会出现以上描述的诸多限制,而增加应用的复杂性。
在实施方式中,对构建的子知识图谱的知识表示的头实体和尾实体作方向性的控制与说明,比如原来的头实体和尾实体是属于关系或继承关系的,还有派生关系的,再或者是以上单一关系的。需要将原本的三元组(头实体,关系,尾实体)再外置一个开关值进行表示,例如0表示双向可逆,1表示单向,即不可逆。另外,对不可分的子知识图谱,做特殊编码处理。
所述存储模块205,构建食品安全知识图谱,并将其存储在Neo4j数据库中。
将上述食品安全领域的实体,以及实体之间的关联关系,以csv格式导入Neo4j数据库中。
在实施方式中,以所述食品安全实体包括食品卫生实体、食品质量实体、食品营养实体为例,可以将该层次的关系存储在csv文件中。
所述配置模块206,启动Neo4j数据库服务,修改Django平台数据库配置文件。
当需要将Neo4j数据库与Django平台进行整合时,首先启动待连接的Neo4j数据库服务,即启动需要整合到Django平台的Neo4j数据库的服务。对所述Neo4j数据库的数据信息:所述Neo4j数据库连接信息、用户名、密码、sql语句模板进行修改配置。
所述展示模块207,将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。
通过读取配置文件中的数据,将Neo4j数据库与Django平台进行连接。将cypher语句执行的结果返回的数据转换成前端展示所需要的JSON格式;利用可视化技术将存储的知识图谱以知识树,图谱等多种形式展示。
如图3和图4所示,为本发明公开的基于图数据库的食品安全知识图谱构建方法和展示模式的实例图。
在图3中,为了在食品安全知识图谱中表示酸奶制作工艺,需要在关系中加入方向性的控制与说明,因为对于该制作工艺来说,三元组并不可逆,所以关系之间加入开关1,表示单向。
在图4中,展示了食品的部分分类。对于图中关系,如乳及乳制品与液体乳类的关系,对于三元组来说,就是可逆的。乳及乳制品包含液体乳类,液体乳类则包含于乳及乳制品,故关系之间加入开关0,表示双向。
如图5所示,为本发明公开的基于图数据库的食品安全知识图谱构建方法和展示模式的流程图。
步骤S101,从不同数据源获取食品安全原始数据:
食品安全数据主要包括:半结构化的食品安全数据和非结构化食品安全数据。半结构化食品安全数据大多来自于网络上百科信息和食品网站规则数据,非结构化食品安全数据则来自于食品安全学这类电子文档。获取食品安全原始数据包括但不限于通过网络爬虫技术、访问已有的行业报告、公开的食品安全数据集、食品安全相关的权威电子书籍。
步骤S102,利用开源的词法工具和食品安全词典进行命名实体识别:
利用预设的词法工具,根据食品安全领域的特点,并利用该词典库,进行命名实体识别。
步骤S103,用于关系抽取获得食品安全实体之间的关系:
对所得的食品安全领域知识进行解析,得到语义信息,利用已建立的食品安全关系提取模型,抽取实体之间的关系。
步骤S104,根据需求设计食品安全领域的动态知识展示模式:
根据需求不同,重组知识图谱,有以下三种不同情形:由于需求不同问题域,或主要表示问题的中心不同,会出现原来的知识实体头变为知识实体为,这按一般知识抽取关系出现了逆向关系;由于问题的大小不同,需要表达的知识关系不会是最原始,一层不变的关系;由于需求的复杂性,原来的子知识图谱与新需求不能完全匹配的问题。
传统的知识图谱表示形式以(头实体,关系,尾实体)的三元组表示形式,均以多种链接的形式进行表示,将知识表示成了无限大的一张图,是实际应用中会出现以上描述的诸多限制,而增加应用的复杂性。
在实施方式中,对构建的子知识图谱的知识表示的头实体和尾实体作方向性的控制与说明,比如原来的头实体和尾实体是属于关系或继承关系的,还有派生关系的,再或者是以上单一关系的。需要将原本的三元组(头实体,关系,尾实体)再外置一个开关值进行表示,例如0表示双向可逆,1表示单向,即不可逆。另外,对不可分的子知识图谱,做特殊编码处理。
步骤S105,构建食品安全知识图谱,并将其存储在Neo4j数据库中:
将上述食品安全领域的实体,以及实体之间的关联关系,以csv格式导入Neo4j数据库中。
在实施方式中,以所述食品安全实体包括食品卫生实体、食品质量实体、食品营养实体为例,可以将该层次的关系存储在csv文件中。
步骤S106,启动Neo4j数据库服务,修改Django平台数据库配置文件:
当需要将Neo4j数据库与Django平台进行整合时,首先启动待连接的Neo4j数据库服务,即启动需要整合到Django平台的Neo4j数据库的服务。对所述Neo4j数据库的数据信息:所述Neo4j数据库连接信息、用户名、密码、sql语句模板进行修改配置。
步骤S107,将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层:
通过读取配置文件中的数据,将Neo4j数据库与Django平台进行连接。将cypher语句执行的结果返回的数据转换成前端展示所需要的JSON格式;利用可视化技术将存储的知识图谱以知识树,图谱等多种形式展示。
上述基于图数据库的食品安全知识图谱构建方法和展示模式,可以实现构建一定规模的食品安全知识图谱,提升了食品领域数据管理效率及数据使用的便捷性,动态重组知识图谱展示模式,可以为大众科普食品安全知识。
对本领域的技术人员来说,可以根据本发明的发明方案和发明构思结合生产的实际需要做出其他相应的改变或调整,而这些改变和调整都应属于本发明所公开的范围。
Claims (10)
1.基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,所述方法包括:
从不同数据源获取大量食品安全原始数据;
利用开源的词法工具和食品安全词典进行命名实体识别;
关系抽取获得食品安全实体之间的关系;
根据需求设计食品安全领域的动态知识展示模式;
构建食品安全知识图谱,并将其存储在Neo4j数据库中;
启动Neo4j数据库服务,修改Django平台数据库配置文件;
将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。
2.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,不同数据源包括:
结构化的食品安全领域知识和半结构化食品安全领域知识。
3.根据权利要求1或2所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,利用开源的词法工具和食品安全词典进行命名实体识别包括:
根据食品安全领域特点,利用预设的开源词法工具,利用食品领域词典库,对领域中其他实体进行命名实体识别。
4.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,关系抽取获得食品安全实体之间的关系包括:
对所得的食品安全领域知识进行解析,得到语义信息,利用已建立的食品安全关系提取模型,抽取实体之间的关系。
5.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,根据需求设计食品安全领域的动态知识展示模式包括:
首先,依据需求划分食品安全领域知识图谱的知识域,在多问题域中划分为不可再分的独立域,再以不可再分的独立域,构建各子知识图谱;其次,依据不同需求,重组知识图谱。
6.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,建食品安全知识图谱,并将其存储在Neo4j数据库中包括:
将上述食品安全领域的实体,以及实体之间的关联关系,以csv格式导入Neo4j数据库中。
7.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,启动Neo4j数据库服务,修改Django平台数据库配置文件包括:
运行Neo4数据库服务,所述修改Django数据库配置文件包括:所述Neo4j数据库连接信息、用户名、密码、查询语句模板。
8.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层包括:
自动读取所述配置文件,将所述Neo4j数据库与所述Django平台连接,将cypher查询语句执行的结果作为返回的数据以JSON数据格式传到前端展示页面。
9.根据权利要求5所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,所述方法还包括包括:
对构建的子知识图谱的知识表示的头实体和尾实体,作方向性的控制与说明,是继承关系或者派生关系,或者是单一关系,可以对原有三元组外置一个开关值表示方向性;0表示双向可逆,1表示单向,即不可逆;另外,对不可分的子知识图谱,做特殊编码处理。
10.根据权利要8所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,所述方法还包括:
在Web前端页面使用可视化技术,对存储的知识图谱以知识树,图谱等多种形式展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910898334.8A CN110633364A (zh) | 2019-09-23 | 2019-09-23 | 基于图数据库的食品安全知识图谱构建方法和展示模式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910898334.8A CN110633364A (zh) | 2019-09-23 | 2019-09-23 | 基于图数据库的食品安全知识图谱构建方法和展示模式 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110633364A true CN110633364A (zh) | 2019-12-31 |
Family
ID=68972376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910898334.8A Pending CN110633364A (zh) | 2019-09-23 | 2019-09-23 | 基于图数据库的食品安全知识图谱构建方法和展示模式 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110633364A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110807105A (zh) * | 2020-01-07 | 2020-02-18 | 成都数联铭品科技有限公司 | 基于知识图谱的数据保存方法及知识图谱的构建方法 |
CN111324609A (zh) * | 2020-02-17 | 2020-06-23 | 腾讯云计算(北京)有限责任公司 | 知识图谱构建方法、装置、电子设备及存储介质 |
CN111427901A (zh) * | 2020-03-23 | 2020-07-17 | 浪潮通用软件有限公司 | 交互式知识图谱数据编辑方法、计算机设备和存储介质 |
CN111488472A (zh) * | 2020-04-09 | 2020-08-04 | 河北利至人力资源服务有限公司 | 一种图数据处理方法及系统 |
CN111897969A (zh) * | 2020-07-27 | 2020-11-06 | 武汉大学 | 一种基于知识图谱的食物成分和营养健康的关联性分析方法及系统 |
CN111930862A (zh) * | 2020-09-17 | 2020-11-13 | 国网浙江省电力有限公司 | 一种基于大数据平台的sql交互式分析方法及系统 |
CN112100405A (zh) * | 2020-09-23 | 2020-12-18 | 中国农业大学 | 一种基于加权lda的兽药残留知识图谱构建方法 |
CN112182236A (zh) * | 2020-09-18 | 2021-01-05 | 成都数联铭品科技有限公司 | 一种知识图谱的构建方法、系统及电子设备 |
CN112487205A (zh) * | 2020-12-03 | 2021-03-12 | 湖北大学 | 一种支持危害鉴别的食品安全风险知识图谱、构建方法 |
CN112800305A (zh) * | 2021-01-12 | 2021-05-14 | 厦门渊亭信息科技有限公司 | 一种基于网络爬虫的知识图谱数据抽取方法及装置 |
CN113517042A (zh) * | 2020-04-10 | 2021-10-19 | 应急管理部化学品登记中心 | 化学品安全知识图谱的构建方法、构建系统和存储介质 |
CN113722430A (zh) * | 2021-08-23 | 2021-11-30 | 北京工业大学 | 面向食品安全的多模态人机交互方法和系统、设备及介质 |
CN113946769A (zh) * | 2021-12-20 | 2022-01-18 | 北京企名片科技有限公司 | 一种用于检索结果的展现方式 |
CN114297370A (zh) * | 2021-12-28 | 2022-04-08 | 北京金堤科技有限公司 | 知识图谱的展示方法及其装置、计算机存储介质、电子设备 |
CN114741526A (zh) * | 2022-03-23 | 2022-07-12 | 中国人民解放军国防科技大学 | 一种网络空间安全领域知识图谱云平台 |
CN115658911A (zh) * | 2022-09-07 | 2023-01-31 | 中国标准化研究院 | 一种食品安全标准关联知识图谱构建方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874378A (zh) * | 2017-01-05 | 2017-06-20 | 北京工商大学 | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 |
CN109508384A (zh) * | 2018-10-31 | 2019-03-22 | 北京国双科技有限公司 | 知识图谱的处理方法、装置、存储介质和处理器 |
-
2019
- 2019-09-23 CN CN201910898334.8A patent/CN110633364A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874378A (zh) * | 2017-01-05 | 2017-06-20 | 北京工商大学 | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 |
CN109508384A (zh) * | 2018-10-31 | 2019-03-22 | 北京国双科技有限公司 | 知识图谱的处理方法、装置、存储介质和处理器 |
Non-Patent Citations (1)
Title |
---|
臧根林等: "知识图谱中的关系方向与强度研究", 《大数据》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110807105A (zh) * | 2020-01-07 | 2020-02-18 | 成都数联铭品科技有限公司 | 基于知识图谱的数据保存方法及知识图谱的构建方法 |
CN111324609A (zh) * | 2020-02-17 | 2020-06-23 | 腾讯云计算(北京)有限责任公司 | 知识图谱构建方法、装置、电子设备及存储介质 |
CN111427901A (zh) * | 2020-03-23 | 2020-07-17 | 浪潮通用软件有限公司 | 交互式知识图谱数据编辑方法、计算机设备和存储介质 |
CN111427901B (zh) * | 2020-03-23 | 2023-10-31 | 浪潮通用软件有限公司 | 交互式知识图谱数据编辑方法、计算机设备和存储介质 |
CN111488472B (zh) * | 2020-04-09 | 2021-07-20 | 河北利至人力资源服务有限公司 | 一种图数据处理方法及系统 |
CN111488472A (zh) * | 2020-04-09 | 2020-08-04 | 河北利至人力资源服务有限公司 | 一种图数据处理方法及系统 |
CN113517042A (zh) * | 2020-04-10 | 2021-10-19 | 应急管理部化学品登记中心 | 化学品安全知识图谱的构建方法、构建系统和存储介质 |
CN111897969A (zh) * | 2020-07-27 | 2020-11-06 | 武汉大学 | 一种基于知识图谱的食物成分和营养健康的关联性分析方法及系统 |
CN111930862A (zh) * | 2020-09-17 | 2020-11-13 | 国网浙江省电力有限公司 | 一种基于大数据平台的sql交互式分析方法及系统 |
CN112182236A (zh) * | 2020-09-18 | 2021-01-05 | 成都数联铭品科技有限公司 | 一种知识图谱的构建方法、系统及电子设备 |
CN112100405A (zh) * | 2020-09-23 | 2020-12-18 | 中国农业大学 | 一种基于加权lda的兽药残留知识图谱构建方法 |
CN112100405B (zh) * | 2020-09-23 | 2024-01-30 | 中国农业大学 | 一种基于加权lda的兽药残留知识图谱构建方法 |
CN112487205A (zh) * | 2020-12-03 | 2021-03-12 | 湖北大学 | 一种支持危害鉴别的食品安全风险知识图谱、构建方法 |
CN112487205B (zh) * | 2020-12-03 | 2022-04-29 | 湖北大学 | 一种支持危害鉴别的食品安全风险知识图谱、构建方法 |
CN112800305A (zh) * | 2021-01-12 | 2021-05-14 | 厦门渊亭信息科技有限公司 | 一种基于网络爬虫的知识图谱数据抽取方法及装置 |
CN113722430A (zh) * | 2021-08-23 | 2021-11-30 | 北京工业大学 | 面向食品安全的多模态人机交互方法和系统、设备及介质 |
CN113946769A (zh) * | 2021-12-20 | 2022-01-18 | 北京企名片科技有限公司 | 一种用于检索结果的展现方式 |
CN114297370A (zh) * | 2021-12-28 | 2022-04-08 | 北京金堤科技有限公司 | 知识图谱的展示方法及其装置、计算机存储介质、电子设备 |
CN114741526A (zh) * | 2022-03-23 | 2022-07-12 | 中国人民解放军国防科技大学 | 一种网络空间安全领域知识图谱云平台 |
CN114741526B (zh) * | 2022-03-23 | 2024-02-02 | 中国人民解放军国防科技大学 | 一种网络空间安全领域知识图谱云平台 |
CN115658911A (zh) * | 2022-09-07 | 2023-01-31 | 中国标准化研究院 | 一种食品安全标准关联知识图谱构建方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110633364A (zh) | 基于图数据库的食品安全知识图谱构建方法和展示模式 | |
Karnitis et al. | Migration of relational database to document-oriented database: Structure denormalization and data transformation | |
CN102947842B (zh) | 用于分析和合成复杂知识表示的系统和方法 | |
US11797585B2 (en) | Data updating method and apparatus, electronic device and computer readable storage medium | |
Cruz et al. | Semi-automatic ontology alignment for geospatial data integration | |
CN110516077A (zh) | 面向企业商情的知识图谱构建方法及装置 | |
Varanka et al. | The map as knowledge base | |
US10924551B2 (en) | IRC-Infoid data standardization for use in a plurality of mobile applications | |
CN109739995A (zh) | 一种信息处理方法及装置 | |
CN109710776B (zh) | 相册的知识图谱的构建方法 | |
US20190026386A1 (en) | Method and apparatus for converting from a source database system to a destination database system | |
CN114138985A (zh) | 文本数据处理的方法、装置、计算机设备以及存储介质 | |
CN111651614A (zh) | 药膳知识图谱的构建方法、系统、电子设备及存储介质 | |
CN112069817A (zh) | 一种学者知识抽取与融合方法及装置 | |
Antunes et al. | Context storage for m2m scenarios | |
CN115878818A (zh) | 一种地理知识图谱构建方法、装置、终端及存储介质 | |
CN115098567A (zh) | 一种基于bi平台的低代码平台数据传输方法 | |
CN115114519A (zh) | 基于人工智能的推荐方法、装置、电子设备及存储介质 | |
Gerbing | R Visualizations: Derive Meaning from Data | |
CN113868322B (zh) | 一种语义结构解析方法、装置、设备及虚拟化系统、介质 | |
Jodłowiec et al. | The extended graph generalization as a representation of the metamodels’ extensional layer | |
Gür | Modeling, Annotating, and Querying Geo-Semantic Data Warehouses | |
CN115146072A (zh) | 一种电力领域中知识地图的绘制方法 | |
US20230306194A1 (en) | Extensible framework for generating accessible captions for data visualizations | |
CN117808328A (zh) | 一种基于图数据库的企业安全生产画像构建方法、装置、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191231 |