CN112487205A - 一种支持危害鉴别的食品安全风险知识图谱、构建方法 - Google Patents
一种支持危害鉴别的食品安全风险知识图谱、构建方法 Download PDFInfo
- Publication number
- CN112487205A CN112487205A CN202011398870.0A CN202011398870A CN112487205A CN 112487205 A CN112487205 A CN 112487205A CN 202011398870 A CN202011398870 A CN 202011398870A CN 112487205 A CN112487205 A CN 112487205A
- Authority
- CN
- China
- Prior art keywords
- food
- knowledge
- additive
- information
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000013305 food Nutrition 0.000 title claims abstract description 234
- 238000010276 construction Methods 0.000 title claims abstract description 19
- 231100001267 hazard identification Toxicity 0.000 title abstract description 6
- 238000000034 method Methods 0.000 claims abstract description 60
- 230000008520 organization Effects 0.000 claims abstract description 11
- 239000000654 additive Substances 0.000 claims description 113
- 230000000996 additive effect Effects 0.000 claims description 89
- 235000015219 food category Nutrition 0.000 claims description 27
- 238000005516 engineering process Methods 0.000 claims description 23
- 230000006378 damage Effects 0.000 claims description 22
- 230000000694 effects Effects 0.000 claims description 16
- 238000012800 visualization Methods 0.000 claims description 10
- 238000013461 design Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 241000282326 Felis catus Species 0.000 claims description 2
- 235000021268 hot food Nutrition 0.000 claims description 2
- 230000009193 crawling Effects 0.000 claims 1
- 238000012216 screening Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 2
- 238000013473 artificial intelligence Methods 0.000 abstract 1
- 238000011160 research Methods 0.000 description 11
- 230000009471 action Effects 0.000 description 9
- 230000007547 defect Effects 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 4
- 239000002994 raw material Substances 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000012850 discrimination method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000021067 refined food Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Animal Behavior & Ethology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于人工智能领域,公开了一种支持危害鉴别的食品安全风险知识图谱、构建方法,设计知识图谱模式层的各节点、关系以及属性;建立Neo4j图数据库;基于海量新闻资讯、论坛贴士、机构数据将专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识,提取构建食品安全知识平台。本发明在保证知识实体的准确性的同时,丰富实体关系和知识间的关联性,构建具有关系丰富,实体间联系紧密的知识图谱模式层。本发明基于海量的新闻资讯、论坛贴士、机构数据将难以理解的专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识。并以此为基础,提取构建食品安全知识平台。
Description
技术领域
本发明属于食品安全知识图谱技术领域,尤其涉及一种支持危害鉴别的食品安全风险知识图谱、构建方法。
背景技术
目前,知识图谱(Knowledge Graph),又被称为知识域可视化或知识领域映射地图,是显示知识结构关系的一系列各种不同的图形。其用可视化技术描述知识资源及其载体,并挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
在知识图谱技术问世之前,人们通常使用深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。随着深度学习技术广泛应用于语音识别,图像识别以及自然语言处理等领域,人们逐渐发现其具有一定的局限性。深度学习通过大量的数据训练能发现事物与事物之间的联系,但其无法解释其中的因果关系,这极大限制了深度学习技术在我们实际生活中的进一步运用。而知识图谱技术是基于图的结构,将事物的背景知识串联起来,使得其在描述事物之间联系的同时也能揭示出它们之间存在的因果关系。
随着大数据技术的发展以及海量数据转化为知识时代的到来,知识图谱技术能够从海量非结构化数据(如文本和图像)和结构化数据中进行知识获取、知识共享,并在大数据时代进行知识创新知识图谱可以高效、直观地描绘出目标对象之间的相关网络,并在多维视角实现对象的真实情况和错综复杂的关系。目前的知识图谱主要运用在地理、生物、文学等领域。
食品安全知识指的是食品及其可能添加剂的信息,包括食品与添加剂的属性、添加目的与鉴别方法等。食品安全知识储备其直接影响民众的生活,也是商品经济下生活水平提高的必然需求。如今,越来越多的民众开始认识到食品安全的重要性,并通过网络平台了解相关知识。然而在实际生活中,并没有统一的食品安全知识平台。这使得民众常常需要面从海量繁多的新闻资讯、论坛贴士、机构数据等信息中总结、发现知识。此外大部分食品安全知识过于专业,使得普通民众难以了解学习,而较为通俗的食品安全知识信息则,也缺乏一定的专业性。
目前在食品安全知识图谱上研究较少,而传统的百科型知识图谱主要以专业数据库作为数据源,因此在食品安全知识图谱的构件上存在一定的问题。网络数据的特性复杂,导致直接利用数据集进行构建会导致知识图谱关系混乱、实体不准确。同时,食品安全知识图谱作为知识平台,需要注重知识的关联性,传统的知识图谱模式层设计主要目的是提高抽取实体的准确性而非丰富实体关系,因此需要改进现有的知识图谱模式,以构建具有关系丰富,实体间联系紧密的知识图谱。此外,针对特定研究目标,并没有形成一套明确的应用研究规范,供对比研究的规范数据样本集也很缺乏。
通过上述分析,现有技术存在的问题及缺陷为:
(1)传统的百科型知识图谱主要以专业数据库作为数据源,网络数据的特性复杂,导致直接利用数据集进行构建会导致知识图谱关系混乱、实体不准确。
(2)传统的知识图谱模式层设计主要目的是提高抽取实体的准确性而非丰富实体关系。
(3)传统知识图谱的针对特定目标无明确的应用研究规范,供对比研究的规范数据样本集也很缺乏。
解决以上问题及缺陷的难度为:
针对第一个缺陷,由于现有知识图谱技术均是以专业数据库为数据源,在开放数据库中构建较为清晰的知识图谱难度较大,且对数据进行处理所花费的成本较高,因此该缺陷用传统方法较难解决。由于传统知识图谱的构建的主要方向在于提高抽取实体的准确性,对于丰富实体关系的相关研究较少,因此第二个问题若要解决需要在现有的研究方法上进行创新,用传统方法解决该缺陷的难度较大。对于第三个缺陷,构建的过程中由于缺乏一套明确的研究规范以及可供对比的样本集,使得构建知识图谱的难度大大增加。
解决以上问题及缺陷的意义为:
通过解决以上问题,最终构建出的知识图谱会拥有更加清晰、丰富的关系以及更加准确的实体。这将令该知识图谱具有更强的实用性。同时,在今后的研究过程中也能为研究人员提供一个较好的参考模板,对于提供明确的研究规范也能起到促进作用。
发明内容
针对现有技术存在的问题,本发明提供了一种支持危害鉴别的食品安全风险知识图谱、构建方法。
本发明是这样实现的,一种基于Neo4j知识图谱技术的食品安全知识平台构建方法,所述基于Neo4j知识图谱技术的食品安全知识平台构建方法包括以下步骤:
首先,在互联网上找到信息可信度较高的食品安全论坛,利用爬虫将数据爬取下来。
将数据进行数据清洗,构建特殊字符词典,统计可能出现的特殊字符如:“、”、“。”、“,”等,以以上特殊字符作为分隔符,将文本分割。分成词语。
构建停用词库,将常见的动词等停用词,利用此词典此再次分割句子。将分割的实体转化为CSV的格式,并筛选高质量数据。
确立知识图谱模式中的核心本体:食品、添加剂。并以此为中心建立知识图谱模式层。
根据设计逻辑,查阅百科资料,并结合数据情况。确立食品与食品大类有关,其具体关系为:食品属于食品大类,由食品指向食品大类。确立添加危害与鉴别方法同时与食品和添加剂有关。确立添加目的与添加剂有关,有添加剂指向添加目的。最后整合上述小关系,构建食品安全知识图谱模式层。
利用Neo4j图数据库,编写脚本,将数据导入到数据库中。
利用Vis实现知识图谱的可视化。并利用Vue框架,将包括知识图谱可视化,知识图谱搜索等部分串联在一起。
具体如下:
步骤一,设计知识图谱模式层的各节点、关系以及属性;
步骤二,建立Neo4j图数据库;
步骤三,基于海量新闻资讯、论坛贴士、机构数据将专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识,提取构建食品安全知识平台。
进一步,步骤一中,所述知识图谱模式层包括8个实体类:食品、食品类别、添加剂、添加作用、详细作用、危害、详细危害、鉴别方法;
所述实体类的实体关系及属性如下:
(1)食品
食品ID:食品ID定义为F-XX-XXX,以字母F开头,中间部分为食品类别ID编号,最后一部分为食品编号,组合为每个食品的唯一ID,此ID与其他两个子系统的食品ID唯一对应;
食品--英文名:食品对应的英文名称,一个食品仅一个英文名;
食品--别名:食品的别名,一个食品可对应多个别名;
食品--属于--食品类别:食品对应的食品类别,一个食品仅对应一种类别;
食品--原材料--食品:制作食品的主要原材料,食品的原材料可指向它本身;
食品--被添加--添加剂:食品可被添加的添加剂,一种食品可被多种添加剂添加。
(2)食品类别
食品类别--英文名:食品类别对应的英文名称,一个类别仅一个英文名;
(3)添加剂
添加剂--英文名:添加剂对应的英文名称,一个添加剂仅一个英文名;
添加剂--添加剂ID:添加加ID定义为T-XXX,以字母F开头,后面为添加剂编号,组合为每种添加剂的唯一ID,此ID与其他两个子系统的添加剂ID唯一对应;
添加剂--添加--食品:添加剂可添加的食品,一种添加剂可添加到多种食品中。
(4)添加作用
食品+添加剂--目的--添加作用:添加剂添加到食品中后,对该食品的颜色、外观、口感等产生的改变;
目标添加剂--目的--添加作用:添加何种添加剂可达到该添加作用;
目标食品--目的--添加作用:何种食品添加后会产生该添加作用。
(5)详细作用
添加作用--目的--详细作用:将添加作用分解为在不同的环境条件下的不同作用。
(6)危害
食品+添加剂--产生--危害:添加剂添加到某种食品中后,对人体会产生的危害;
危害--影响对象:被添加后会产生该危害的食品;
危害--产生来源:可以产生该危害的添加剂。
(7)详细危害
危害--产生环境--详细危害:将产生危害分解为在不同的环境条件、不同剂量下的不同危害;
详细危害--危害等级:将不同的危害进行等级程度分类。
(8)鉴别方法
鉴别方法--鉴别--食品:鉴别食品是否添加添加剂的方法;
鉴别方法--针对--添加剂:针对添加剂是否添加的鉴别方法;
鉴别方法--详细方法:针对食品和添加剂对应辨别方法的详细说明。
进一步,所述基于Neo4j知识图谱技术的食品安全知识平台构建方法,还包括:
(1)关键字搜索获取节点名称get_search:用于输入关键字搜索,模糊匹配节点名称,得到一组相关的节点名称,节点ID,使用ajax请求这个地址获取json数据后展示到页面上;
(2)获取知识图谱子图get_food_dataset:用于通过食品ID,得到食品数据集列表,包括食品名称,食品别名,添加剂名称,该添加剂对人体的危害,添加后该食品在颜色、味觉等方面的异常表现,如何辨别该食品是否添加了该添加剂;
(3)获取指定节点的相关信息get_food_harm:用于通过食品ID,得到食品数据集列表,包括食品名称,食品别名,添加剂名称,该添加剂对人体的危害,添加后该食品在颜色、味觉等方面的异常表现,如何辨别该食品是否添加了该添加剂;
(4)获取默认情况下的食品词条可视化列表get_common_food:用于获取最近几年的热门食品安全事件中的食品名称,食品ID;
(5)获取食品类别一级节点列表get_cate_food:用于返回所有食品类别及该类别下的所有食品;
(6)获取默认情况下的食品分类列表展示get_all_cate:用于返回所有的食品大类列表,包括食品类别名称,食品类别ID;
(7)获取其他模块所需的食品图谱get_others_kg:用于通过食品ID,获取该食品名称,别名及其常见的添加剂,关系;
(8)获取指定添加剂关联的食品列表get_add_food:用于通过添加剂ID,获取该添加剂关联的食品列表,包括食品ID,食品名称。
本发明另一目的在于提供一种利用所述知识图谱技术的食品安全知识平台构建方法构建的食品安全知识平台。
通过知识图谱的方式,直观地将食品及其相关添加剂之间的关联关系以及添加作用,产生危害展示在用户面前。图谱中的每一个实体节点均可点选,点击某节点后,可视化模块即发生扩展,扩展出一个以该实体节点为中心的子图,并突出展示该接节点及其实体、实体关系。用户能十分清晰地了解到相关食品的安全风险知识。
本发明另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
构建知识图谱模式层的各节点、关系以及属性;
建立Neo4j图数据库;
基于海量新闻资讯、论坛贴士、机构数据将专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识,提取构建食品安全知识平台
本发明另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤
构建知识图谱模式层的各节点、关系以及属性;
建立Neo4j图数据库;
基于海量新闻资讯、论坛贴士、机构数据将专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识,提取构建食品安全知识平台
本发明另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的知识图谱技术的食品安全知识平台构建方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的基于Neo4j知识图谱技术的食品安全知识平台构建方法,在保证知识实体的准确性的同时,丰富实体关系和知识间的关联性,构建具有关系丰富,实体间联系紧密的知识图谱模式层。本发明基于海量的新闻资讯、论坛贴士、机构数据将难以理解的专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识。并以此为基础,提取构建了食品安全知识平台。
相较于传统的基于开放数据源所构建出的知识图谱,本发明所构建出知识图谱中的实体更加准确,实体之间的关联性更加丰富、清晰,实体的信息也更加全面。同时通过知识图谱可视化展示方式,用户可以非常直观地了解食品安全风险信息,能更容易理解在传统展示手段下较为晦涩难懂的专业知识。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于Neo4j知识图谱技术的食品安全知识平台构建方法流程图。
图2是本发明实施例提供的知识图谱模式层结构示意图。
图3是本发明实施例提供的基于neo4j构建的食品安全风险知识图谱。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种支持危害鉴别的食品安全风险知识图谱、构建方法,下面结合附图对本发明作详细的描述。
本发明,首先,在互联网上找到信息可信度较高的食品安全论坛,利用爬虫将数据爬取下来。
将数据进行数据清洗,构建特殊字符词典,统计可能出现的特殊字符如:“、”、“。”、“,”等,以以上特殊字符作为分隔符,将文本分割。分成词语。
构建停用词库,将常见的动词等停用词,利用此词典此再次分割句子。将分割的实体转化为CSV的格式,并筛选高质量数据。
确立知识图谱模式中的核心本体:食品、添加剂。并以此为中心建立知识图谱模式层。
根据设计逻辑,查阅百科资料,并结合数据情况。确立食品与食品大类有关,其具体关系为:食品属于食品大类,由食品指向食品大类。确立添加危害与鉴别方法同时与食品和添加剂有关。确立添加目的与添加剂有关,有添加剂指向添加目的。最后整合上述小关系,构建食品安全知识图谱模式层。
利用Neo4j图数据库,编写脚本,将数据导入到数据库中。
利用Vis实现知识图谱的可视化。并利用Vue框架,将包括知识图谱可视化,知识图谱搜索等部分串联在一起。
创新理念:传统方式通常是以表格以及图标等方式展示,这样展示的信息虽然在数据上较为直观,但往往只着重于展示实体本身,而忽略它们之间的联系。通过知识图谱的展示方式,实体之间的联系更加清晰。用户通常在直观地了解数据的同时也能通过观察实体之间的相互关系挖掘出一些通过传统展示方式难以捕捉到的信息。
下面结合具体实施例对本发明的技术方案作进一步描述。
实施例1
如图1所示,本发明实施例提供的基于Neo4j知识图谱技术的食品安全知识平台构建方法包括以下步骤:
S101,设计知识图谱模式层的各节点、关系以及属性;
S102,建立Neo4j图数据库;
S103,基于海量新闻资讯、论坛贴士、机构数据将专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识,提取构建食品安全知识平台。
实施例2
一、知识图谱模式层的设计(如图2所示)
二、模式层各节点、关系、属性的定义
模式层共有8个实体类,实体关系及属性如下:
(1)食品
食品——食品ID
食品ID定义为F-XX-XXX,以字母F开头,中间部分为食品类别ID编号,最后一部分为食品编号,组合为每个食品的唯一ID,此ID与其他两个子系统的食品ID唯一对应。
食品——英文名
食品对应的英文名称,一个食品仅一个英文名。
食品——别名
食品的别名,一个食品可对应多个别名。
食品——属于——食品类别
食品对应的食品类别,一个食品仅对应一种类别
食品——原材料——食品
可制作食品的主要原材料,某食品的原材料可指向它本身。
食品——被添加——添加剂
某种食品可被添加的添加剂,一种食品可被多种添加剂添加
(2)食品类别
食品类别——英文名
食品类别对应的英文名称,一个类别仅一个英文名
(3)添加剂
添加剂——英文名
添加剂对应的英文名称,一个添加剂仅一个英文名
添加剂——添加剂ID
添加加ID定义为T-XXX,以字母F开头,后面为添加剂编号,组合为每种添加剂的唯一ID,此ID与其他两个子系统的添加剂ID唯一对应。
添加剂——添加——食品
某种添加剂可添加的食品,一种添加剂可添加到多种食品中。
(4)添加作用
食品+添加剂——目的——添加作用
某种添加剂添加到某种食品中后,对该食品的颜色、外观、口感等产生的改变。
目标添加剂——目的——添加作用
即添加何种添加剂可达到该添加作用。
目标食品——目的——添加作用
即何种食品添加后会产生该添加作用。
(5)详细作用
添加作用——目的【环境】——详细作用
将添加作用分解为在不同的环境条件下的不同作用。
(6)危害
食品+添加剂——产生——危害
某种添加剂添加到某种食品中后,对人体会产生的危害。
危害——影响对象
即被添加后会产生该危害的食品。
危害——产生来源
即可以产生该危害的添加剂。
(7)详细危害
危害——产生【环境】——详细危害
将产生危害分解为在不同的环境条件、不同剂量下的不同危害。
详细危害——危害等级
将不同的危害进行等级程度分类。
(8)鉴别方法
鉴别方法——鉴别——食品
鉴别某种食品是否添加了某种添加剂的方法。
鉴别方法——针对——添加剂
针对某种添加剂是否添加的鉴别方法。
鉴别方法——详细方法
针对该食品和添加剂对应辨别方法的详细说明。
三、Neo4j图数据库建立示例语句
1.CREATE(添加剂:添加剂{节点名:'添加剂',属性:'英文名'})-[:添加到]->(食品:食品{节点名:'食品名',属性1:'别名',属性2:'英文名'})-[:属于]->(食品类别:食品类别{节点名:'食品类别',属性:'英文名'})-[:产生]->(人体危害:人体危害{节点名:'人体危害',属性1:'影响对象',属性2:'产生来源'})-[:产生{关系属性:'环境'}]->(详细危害:详细危害{节点名:'详细危害',属性:'具体危害'})
2.CREATE(鉴别方法:鉴别方法{节点名:'鉴别方法',属性1:'鉴别对象',属性2:'针对对象',属性3:'详细方法'})-[:针对]->(添加剂)-[:产生]->(人体危害)
3.CREATE(食品)-[:制作成]->(食品)
4.CREATE(鉴别方法)-[:鉴别]->(食品)
5.CREATE(添加剂)-[:目的]->(添加作用:添加作用{节点名:'添加作用',属性1:'目标添加剂',属性2:'目标食物'})-[:目的{关系属性:'环境'}]->(详细目的:详细目的{节点名:'详细目的',属性:'具体目的'})
6.CREATE(食品)-[:目的]->(添加作用)
实施例3
一、数据库建立
LOAD CSV WITH HEADERS FROM"file:///M.csv"AS line create(M:鉴别方法{详细方法:line.Method,ID:line.M_ID})
LOAD CSV WITH HEADERS FROM"file:///A.csv"AS line create(A:添加剂{添加剂名:line.Additive})
LOAD CSV WITH HEADERS FROM"file:///F.csv"AS line create(F:食品{食品名:line.Food})
LOAD CSV WITH HEADERS FROM"file:///C.csv"AS line create(C:食品大类{大类名:line.Category})
LOAD CSV WITH HEADERS FROM"file:///D.csv"AS line create(D:详细危害{详细危害:line.Damage})
LOAD CSV WITH HEADERS FROM"file:///E.csv"AS line create(E:详细作用{详细作用:line.Effecct})
LOAD CSV WITH HEADERS FROM"file:///FAM.csv"AS line match(A:添加剂{添加剂名:line['Additive']})match(F:食品{食品名:line['Food']})create(M:鉴别方法{详细方法:line.Method,鉴别食品:line.Food,鉴别添加剂:line.Additive})merge(M)-[a:鉴别]->(F)merge(M)-[b:针对]->(A)return a,b
LOAD CSV WITH HEADERS FROM"file:///FC.csv"AS line match(F:食品{食品名:line['Food']})match(C:食品大类{大类名:line['Category']})merge(F)-[c:属于]->(C)return c
LOAD CSV WITH HEADERS FROM"file:///FAE.csv"AS line match(A:添加剂{添加剂名:line['Additive']})
match(F:食品{食品名:line['Food']})match(E:详细作用{详细作用:line['Effecct']})merge(EE:添加作用{添加作用:"添加作用",作用食物:line.Food,作用添加剂:line.Additive})merge(A)-[a:目的]->(EE)-[c:目的{环境:'null'}]->(E)merge(F)-[b:目的]->(EE)return a,b,c
LOAD CSV WITH HEADERS FROM"file:///FAD.csv"AS line match(A:添加剂{添加剂名:line['Additive']})match(F:食品{食品名:line['Food']})match(D:详细危害{详细危害:line['Damage']})merge(DD:人体危害{人体危害:"人体危害",来源食物:line.Food,来源添加剂:line.Additive})create(A)-[a:产生]->(DD)-[c:产生{环境:line['Condition']}]->(D)merge(F)-[b:产生]->(DD)merge(F)-[d:添加到]->(A)returna,b,c,d
二、基于neo4j构建的食品安全风险知识图谱(如图3所示)
三、功能接口设计
1.1关键字搜索获取节点名称
1.2获取知识图谱子图
1.3获取指定节点的相关信息(添加剂、危害等)
1.4获取默认情况下的食品词条可视化列表
1.5获取食品类别一级节点列表
1.6获取默认情况下的食品分类列表展示
1.7获取其他模块所需的食品图谱
1.8获取指定添加剂关联的食品列表
在本实施例中,通过本研究的方法构建了由包含116种人体危害、78种食物、61种添加剂、116种添加作用、30种详细作用、53种详细危害、182种鉴别方法、18种食品大类等在内的共654个不同知识实体,并通过产生、属性、添加到、目的、鉴别、针对六种不同关系链接在一起,共计食品关系1844条。并通过Vis.js的专业可视化库进行可视化,在Vue框架下实现搜索。扩展等不同交互。此外还提供了诸多搜索查询接口。
并可以通过地址:
http://47.107.62.116:8082/#/knowledge访问。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种基于Neo4j知识图谱技术的食品安全知识平台构建方法,其特征在于,所述基于Neo4j知识图谱技术的食品安全知识平台构建方法包括:
构建知识图谱模式层的各节点、关系以及属性;
建立Neo4j图数据库;
基于海量新闻资讯、论坛贴士、机构数据将专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识,提取构建食品安全知识平台。
2.如权利要求1所述的知识图谱技术的食品安全知识平台构建方法,其特征在于,所述知识图谱模式层包括:食品、食品类别、添加剂、添加作用、详细作用、危害、详细危害、鉴别方法。
3.如权利要求1所述的知识图谱技术的食品安全知识平台构建方法,其特征在于,所述知识图谱技术的食品安全知识平台构建方法,还包括:
(1)关键字搜索获取节点名称get_search:用于输入关键字搜索,模糊匹配节点名称,得到一组相关的节点名称,节点ID,使用ajax请求这个地址获取json数据后展示到页面上;
(2)获取知识图谱子图get_food_dataset:用于通过食品ID,得到食品数据集列表,包括食品名称,食品别名,添加剂名称,该添加剂对人体的危害,添加后该食品在颜色、味觉等方面的异常表现,如何辨别该食品是否添加了该添加剂;
(3)获取指定节点的相关信息get_food_harm:用于通过食品ID,得到食品数据集列表,包括食品名称,食品别名,添加剂名称,该添加剂对人体的危害,添加后该食品在颜色、味觉等方面的异常表现,如何辨别该食品是否添加了该添加剂;
(4)获取默认情况下的食品词条可视化列表get_common_food:用于获取最近几年的热门食品安全事件中的食品名称,食品ID;
(5)获取食品类别一级节点列表get_cate_food:用于返回所有食品类别及该类别下的所有食品;
(6)获取默认情况下的食品分类列表展示get_all_cate:用于返回所有的食品大类列表,包括食品类别名称,食品类别ID;
(7)获取其他模块所需的食品图谱get_others_kg:用于通过食品ID,获取该食品名称,别名及其常见的添加剂,关系;
(8)获取指定添加剂关联的食品列表get_add_food:用于通过添加剂ID,获取该添加剂关联的食品列表,包括食品ID,食品名称。
4.如权利要求1所述的知识图谱技术的食品安全知识平台构建方法,其特征在于,所述知识图谱技术的食品安全知识平台构建方法进一步包括:
首先,在互联网上找到信息可信度较高的食品安全论坛,利用爬虫将数据爬取下来;
将数据进行数据清洗,构建特殊字符词典,统计可能出现的特殊字符如:“、”、“。”、“,”,以以上特殊字符作为分隔符,将文本分割;分成词语;
构建停用词库,将常见的动词等停用词,利用此词典此再次分割句子;将分割的实体转化为CSV的格式,并筛选高质量数据;
确立知识图谱模式中的核心本体:食品、添加剂;并以此为中心建立知识图谱模式层;
根据设计逻辑,并结合数据情况;确立食品与食品大类有关,具体关系为:食品属于食品大类,由食品指向食品大类。确立添加危害与鉴别方法同时与食品和添加剂有关;确立添加目的与添加剂有关,有添加剂指向添加目的;最后整合上述小关系,构建食品安全知识图谱模式层;
利用Neo4j图数据库,编写脚本,将数据导入到数据库中;
利用Vis实现知识图谱的可视化;并利用Vue框架,将包括知识图谱可视化,知识图谱搜索等部分串联在一起。
5.一种利用权利要求1~4任意一项所述知识图谱技术的食品安全知识平台构建方法构建的食品安全知识平台。
6.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
构建知识图谱模式层的各节点、关系以及属性;
建立Neo4j图数据库;
基于海量新闻资讯、论坛贴士、机构数据将专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识,提取构建食品安全知识平台。
7.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
构建知识图谱模式层的各节点、关系以及属性;
建立Neo4j图数据库;
基于海量新闻资讯、论坛贴士、机构数据将专业知识信息总结成便于理解的信息,并将非专业知识凝练提取成有用的知识,提取构建食品安全知识平台。
8.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现权利要求1~4任意一项所述的知识图谱技术的食品安全知识平台构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011398870.0A CN112487205B (zh) | 2020-12-03 | 2020-12-03 | 一种支持危害鉴别的食品安全风险知识图谱、构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011398870.0A CN112487205B (zh) | 2020-12-03 | 2020-12-03 | 一种支持危害鉴别的食品安全风险知识图谱、构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112487205A true CN112487205A (zh) | 2021-03-12 |
CN112487205B CN112487205B (zh) | 2022-04-29 |
Family
ID=74939189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011398870.0A Active CN112487205B (zh) | 2020-12-03 | 2020-12-03 | 一种支持危害鉴别的食品安全风险知识图谱、构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112487205B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114491071A (zh) * | 2022-01-27 | 2022-05-13 | 北京工商大学 | 一种基于跨媒体数据的食品安全知识图谱构建方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874378A (zh) * | 2017-01-05 | 2017-06-20 | 北京工商大学 | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 |
US20180239751A1 (en) * | 2017-02-22 | 2018-08-23 | Google Inc. | Optimized graph traversal |
CN110633364A (zh) * | 2019-09-23 | 2019-12-31 | 中国农业大学 | 基于图数据库的食品安全知识图谱构建方法和展示模式 |
CN110674274A (zh) * | 2019-09-23 | 2020-01-10 | 中国农业大学 | 一种针对食品安全法规问答系统的知识图谱构建方法 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
CN111694968A (zh) * | 2020-06-15 | 2020-09-22 | 北京工商大学 | 基于半结构化数据的生鲜食品供应链知识图谱构建方法 |
-
2020
- 2020-12-03 CN CN202011398870.0A patent/CN112487205B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874378A (zh) * | 2017-01-05 | 2017-06-20 | 北京工商大学 | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 |
US20180239751A1 (en) * | 2017-02-22 | 2018-08-23 | Google Inc. | Optimized graph traversal |
CN110633364A (zh) * | 2019-09-23 | 2019-12-31 | 中国农业大学 | 基于图数据库的食品安全知识图谱构建方法和展示模式 |
CN110674274A (zh) * | 2019-09-23 | 2020-01-10 | 中国农业大学 | 一种针对食品安全法规问答系统的知识图谱构建方法 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
CN111694968A (zh) * | 2020-06-15 | 2020-09-22 | 北京工商大学 | 基于半结构化数据的生鲜食品供应链知识图谱构建方法 |
Non-Patent Citations (3)
Title |
---|
WAN TAO: "A Cross-Field Construction Method of Chinese Tourism Knowledge Graph based on Expasion and Adjustment of Entities", 《2020 IEEE 5TH INFORMATION TECHNOLOGY AND MECHATRONICS ENGINEERING CONFERENCE (ITOEC)》 * |
杨荣等: "基于知识图谱的信息查询系统设计与实现", 《计算机与数字工程》 * |
王杰等: "航空安全事件知识图谱构建", 《中国科技信息》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114491071A (zh) * | 2022-01-27 | 2022-05-13 | 北京工商大学 | 一种基于跨媒体数据的食品安全知识图谱构建方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112487205B (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Omena et al. | Digital methods for hashtag engagement research | |
Stieglitz et al. | Social media analytics–Challenges in topic discovery, data collection, and data preparation | |
US10725836B2 (en) | Intent-based organisation of APIs | |
US10997244B2 (en) | Method and system for identifying and discovering relationships between disparate datasets from multiple sources | |
US10740678B2 (en) | Concept hierarchies | |
US11194797B2 (en) | Automatic transformation of complex tables in documents into computer understandable structured format and providing schema-less query support data extraction | |
KR101793222B1 (ko) | 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트 | |
WO2018072071A1 (zh) | 知识图谱构建系统及方法 | |
US20160328650A1 (en) | Mining Forums for Solutions to Questions | |
Desimoni et al. | Empirical evaluation of linked data visualization tools | |
US20140282219A1 (en) | Intelligent internet system with adaptive user interface providing one-step access to knowledge | |
US11194798B2 (en) | Automatic transformation of complex tables in documents into computer understandable structured format with mapped dependencies and providing schema-less query support for searching table data | |
CN112199961B (zh) | 一种基于深度学习的知识图谱获取方法 | |
CN112988784B (zh) | 数据查询方法、查询语句生成方法及其装置 | |
WO2019129832A1 (en) | Systems and methods for context-independent database search paths | |
US11574123B2 (en) | Content analysis utilizing general knowledge base | |
US20200334251A1 (en) | Automatic transformation of complex tables in documents into computer understandable structured format and managing dependencies | |
US20150127657A1 (en) | Method and Computer for Indexing and Searching Structures | |
CN112084333A (zh) | 一种基于情感倾向分析的社交用户生成方法 | |
CN112330510A (zh) | 一种志愿推荐方法、装置、服务器及计算机可读存储介质 | |
CN112487205B (zh) | 一种支持危害鉴别的食品安全风险知识图谱、构建方法 | |
Dattolo et al. | Visualbib: narrative views for customized bibliographies | |
Alzboon | Semantic text analysis on social networks and data processing: review and future directions | |
Fan et al. | CICHMKG: a large-scale and comprehensive Chinese intangible cultural heritage multimodal knowledge graph | |
US10204146B2 (en) | Automatic natural language processing based data extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |