CN111160923A - 一种用于食品溯源和分析的图数据库构建系统 - Google Patents

一种用于食品溯源和分析的图数据库构建系统 Download PDF

Info

Publication number
CN111160923A
CN111160923A CN201811313187.5A CN201811313187A CN111160923A CN 111160923 A CN111160923 A CN 111160923A CN 201811313187 A CN201811313187 A CN 201811313187A CN 111160923 A CN111160923 A CN 111160923A
Authority
CN
China
Prior art keywords
data
food
external
module
graph database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811313187.5A
Other languages
English (en)
Inventor
张会峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inesa R&d Center
Original Assignee
Inesa R&d Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inesa R&d Center filed Critical Inesa R&d Center
Priority to CN201811313187.5A priority Critical patent/CN111160923A/zh
Publication of CN111160923A publication Critical patent/CN111160923A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud

Landscapes

  • Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种用于食品溯源和分析的图数据库构建系统,包括:数据获取模块,用于获取内外部数据;数据预处理模块,用于对所述内外部数据进行预处理;特征提取模块,接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;图数据库生成模块,根据所述标签和实体关系构建数据模型,生成图数据库。与现有技术相比,本发明有效地存储和表征了食品企业的基本信息、食品安全情况以及企业之间的关系,具有查询效率高、伸缩性灵活性好等优点。

Description

一种用于食品溯源和分析的图数据库构建系统
技术领域
本发明涉及食品安全领域,尤其是涉及一种用于食品溯源和分析的图数据库构建系统。
背景技术
食品安全问题越来越得到社会的重视,也涌现出了很多的解决方法,包括食品追溯体系的建立和成熟,以及各种各样的食品安全的评价体系和方法。食品的来源和生产过程是整个食品安全问题中的源头和保障,也是食品安全的根本,市场上售卖的各种食品是人们日常生活中最重要的组成部分,其安全性能直接关乎人们的身体健康,因此对其溯源信息的记录和查询是必不可少的。
由于食品的流通涉及多个企业,构成一张张复杂网络,面对这样的数据特点,现有的结构化数据库,以及部分非结构化数据库,存在信息表征不完整,查询效率低下等问题。同时,大部分溯源信息用于食品安全事件的事后处理查询,无法基于现有溯源信息进行常态化食品安全评估以及食品安全事件发生时关联企业事前预警。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种用于食品溯源和分析的图数据库构建系统。
本发明的目的可以通过以下技术方案来实现:
一种用于食品溯源和分析的图数据库构建系统,包括:
数据获取模块,用于获取内外部数据;
数据预处理模块,用于对所述内外部数据进行预处理;
特征提取模块,接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;
图数据库生成模块,根据所述标签和实体关系构建数据模型,生成图数据库。
进一步地,所述数据获取模块包括:
内部数据获取单元,用于对多数据源、不同数据库类型的数据库数据进行采集,生成内部数据;
外部数据获取单元,用于利用高频爬虫方法获取外部网页数据,生成外部数据。
进一步地,所述外部网页数据包括食品安全事件数据。
进一步地,所述数据预处理模块包括:
内部数据处理单元,用于对内部数据进行预处理,所述预处理包括数据清洗、数据格式变换和多数据源数据集成;
外部数据分析单元,用于对获取的外部数据运用人工智能技术进行数据分析。
进一步地,所述标签包括基础标签和计算标签,所述基础标签和实体关系根据内部数据生成,所述计算标签根据外部数据生成。
进一步地,该系统还包括:
食品安全评价模块,用于根据所述图数据库计算食品企业的食品安全指数,进行食品安全评价。
进一步地,该系统还包括:
查询模块,用于根据外部查询请求调用所述图数据库并实现可视化。
与现有技术相比,本发明有效地存储和表征了食品企业的基本信息、食品安全情况以及企业之间的关系,在获取食品溯源数据时涉及到复杂的企业关系,本系统具有非常高效的查询性能,同时,本系统具有很大的伸缩性和灵活性,随着企业节点的增加时,不会影响原有企业数据的正常使用。
本发明具有以如下有益效果:
1.多数据源:打通已有的数据库系统,引入外部网页爬虫数据;
2.引入人工智能技术,监测企业关联食品安全事件;
3.本发明构建了食品企业的企业关系图数据库,与传统结构化数据库相比,信息表征完善,显著提高查询速度,有很大的伸缩性和灵活性;
4.通过食品安全指数标签,量化企业食品安全情况。
附图说明
图1为本发明的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例提供一种用于食品溯源和分析的图数据库构建系统,包括数据获取模块、数据预处理模块、特征提取模块和图数据库生成模块,其中,数据获取模块用于获取内外部数据;数据预处理模块用于对所述内外部数据进行预处理;特征提取模块接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;图数据库生成模块根据所述标签和实体关系构建数据模型,生成图数据库。
具体地,数据获取模块包括内部数据获取单元和外部数据获取单元,内部数据获取单元用于对多数据源、不同数据库类型的数据库数据进行采集,生成内部数据;外部数据获取单元用于利用高频爬虫方法获取外部网页数据,生成外部数据,所述外部网页数据包括食品安全事件数据等。
数据预处理模块包括内部数据处理单元和外部数据分析单元,内部数据处理单元用于对内部数据进行预处理,所述预处理包括数据清洗、数据格式变换和多数据源数据集成;外部数据分析单元用于对获取的外部数据运用人工智能技术进行数据分析。
标签包括基础标签和计算标签,将从数据库中提取的企业间关系划分为实体关系;将从数据库中直接获取的标签划分为基本标签;将所述的基于人工智能技术分析后的食品安全事件信息划分为计算标签。具体地,根据实体关系生成方法,获取内部数据库中企业间关系关联的数据表字段及值;根据基础标签的分类与生成方法,获取内部数据库中企业实体的标签关联的数据表字段及值;根据计算标签的分类与生成方法,对网页数据进行自然语言数据处理,挖掘食品安全信息并关联到企业实体。
在某些实施例中,该系统还包括食品安全评价模块,用于根据所述图数据库计算食品企业的食品安全指数,进行食品安全评价。具体地,基于所述的基本信息和食品安全信息计算标签,通过一种基于食品追溯的动态食品安全评价方法和评价装置(申请号:2018111080309)中所述方法计算,获取的食品安全指数划分为计算标签。
在某些实施例中,该系统还包括查询模块,用于根据外部查询请求调用所述图数据库并实现可视化,方便快速查询。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (7)

1.一种用于食品溯源和分析的图数据库构建系统,其特征在于,包括:
数据获取模块,用于获取内外部数据;
数据预处理模块,用于对所述内外部数据进行预处理;
特征提取模块,接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;
图数据库生成模块,根据所述标签和实体关系构建数据模型,生成图数据库。
2.根据权利要求1所述的用于食品溯源和分析的图数据库构建系统,其特征在于,所述数据获取模块包括:
内部数据获取单元,用于对多数据源、不同数据库类型的数据库数据进行采集,生成内部数据;
外部数据获取单元,用于利用高频爬虫方法获取外部网页数据,生成外部数据。
3.根据权利要求2所述的用于食品溯源和分析的图数据库构建系统,其特征在于,所述外部网页数据包括食品安全事件数据。
4.根据权利要求2所述的用于食品溯源和分析的图数据库构建系统,其特征在于,所述数据预处理模块包括:
内部数据处理单元,用于对内部数据进行预处理,所述预处理包括数据清洗、数据格式变换和多数据源数据集成;
外部数据分析单元,用于对获取的外部数据运用人工智能技术进行数据分析。
5.根据权利要求2所述的用于食品溯源和分析的图数据库构建系统,其特征在于,所述标签包括基础标签和计算标签,所述基础标签和实体关系根据内部数据生成,所述计算标签根据外部数据生成。
6.根据权利要求1所述的用于食品溯源和分析的图数据库构建系统,其特征在于,该系统还包括:
食品安全评价模块,用于根据所述图数据库计算食品企业的食品安全指数,进行食品安全评价。
7.根据权利要求1所述的用于食品溯源和分析的图数据库构建系统,其特征在于,该系统还包括:
查询模块,用于根据外部查询请求调用所述图数据库并实现可视化。
CN201811313187.5A 2018-11-06 2018-11-06 一种用于食品溯源和分析的图数据库构建系统 Pending CN111160923A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811313187.5A CN111160923A (zh) 2018-11-06 2018-11-06 一种用于食品溯源和分析的图数据库构建系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811313187.5A CN111160923A (zh) 2018-11-06 2018-11-06 一种用于食品溯源和分析的图数据库构建系统

Publications (1)

Publication Number Publication Date
CN111160923A true CN111160923A (zh) 2020-05-15

Family

ID=70554418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811313187.5A Pending CN111160923A (zh) 2018-11-06 2018-11-06 一种用于食品溯源和分析的图数据库构建系统

Country Status (1)

Country Link
CN (1) CN111160923A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782888A (zh) * 2020-07-01 2020-10-16 内蒙古显鸿科技股份有限公司 一种采用图数据库技术的产品全流程追溯系统
CN116681357A (zh) * 2023-07-28 2023-09-01 济南市莱芜区综合检验检测中心 基于人工智能的食品质量分析系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020829A (zh) * 2012-12-11 2013-04-03 华南农业大学 一种空间可视化展现的二维码食品信息溯源方法
US20130089838A1 (en) * 2011-10-06 2013-04-11 Lisa Jeanne Adkins Food safety and risk analyzer
CN106874378A (zh) * 2017-01-05 2017-06-20 北京工商大学 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN108197132A (zh) * 2017-10-09 2018-06-22 国网陕西省电力公司 一种基于图数据库的电力资产画像构建方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130089838A1 (en) * 2011-10-06 2013-04-11 Lisa Jeanne Adkins Food safety and risk analyzer
CN103020829A (zh) * 2012-12-11 2013-04-03 华南农业大学 一种空间可视化展现的二维码食品信息溯源方法
CN106874378A (zh) * 2017-01-05 2017-06-20 北京工商大学 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN108197132A (zh) * 2017-10-09 2018-06-22 国网陕西省电力公司 一种基于图数据库的电力资产画像构建方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782888A (zh) * 2020-07-01 2020-10-16 内蒙古显鸿科技股份有限公司 一种采用图数据库技术的产品全流程追溯系统
CN116681357A (zh) * 2023-07-28 2023-09-01 济南市莱芜区综合检验检测中心 基于人工智能的食品质量分析系统及方法
CN116681357B (zh) * 2023-07-28 2023-10-27 济南市莱芜区综合检验检测中心 基于人工智能的食品质量分析系统及方法

Similar Documents

Publication Publication Date Title
CN111240662B (zh) 一种基于任务可视化拖拽的spark机器学习系统及学习方法
CN110516077A (zh) 面向企业商情的知识图谱构建方法及装置
CN111709235A (zh) 一种基于自然语言处理的文本数据统计分析系统及方法
CN112000773A (zh) 基于搜索引擎技术的数据关联关系挖掘方法及应用
CN110955690A (zh) 一种基于大数据技术的自助数据标签平台及自助数据标签方法
CN111160923A (zh) 一种用于食品溯源和分析的图数据库构建系统
CN112634004B (zh) 征信数据的血缘图谱分析方法与系统
CN116842142B (zh) 一种医疗器械智能化检索系统
Ling et al. Research on Intelligent Supervision and Application System of Food Traceability Based on Blockchain and Artificial intelligence
CN112527924A (zh) 动态更新的知识图谱扩展方法及装置
CN116010662A (zh) 一种能源消费-碳排放查询系统的构建方法、装置及介质
Sharma et al. Deep learning in big data and data mining
CN113609848A (zh) 一种工业产品质量安全监管方法及装置
CN113344604A (zh) 一种基于用户行为数据及流计算的用户细分方法
CN112464668A (zh) 一种提取智能家居行业动态信息的方法和系统
CN111125198A (zh) 一种基于时间序列的计算机数据挖掘聚类方法
Shrivastava et al. Graph mining framework for finding and visualizing substructures using graph database
Liu et al. Automotive prospective technology mining method based on big data content analysis
CN117633051A (zh) 一种基于五类网络数据的虚实实体探测技术
CN105677768A (zh) 基于复杂产品网络化分类分析系统
CN114201614A (zh) 基于知识图谱的跨游戏平台数据处理方法
He et al. Research on Intelligent Question-Answer System for Tender Information Based on Knowledge Graph
Teng et al. VDQAM: A toolkit for database quality evaluation based on visual morphology
CN117786425A (zh) 基于大数据和机器学习的生态环境数据特征识别算法
Wu et al. Design for Ship Electronic Information System Based on Data Mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination