CN114547168B - 基于虚拟知识图谱的精细化工安全生产数据融合与重构方法 - Google Patents
基于虚拟知识图谱的精细化工安全生产数据融合与重构方法 Download PDFInfo
- Publication number
- CN114547168B CN114547168B CN202210099893.4A CN202210099893A CN114547168B CN 114547168 B CN114547168 B CN 114547168B CN 202210099893 A CN202210099893 A CN 202210099893A CN 114547168 B CN114547168 B CN 114547168B
- Authority
- CN
- China
- Prior art keywords
- data
- database
- mapping
- fine chemical
- dcs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 43
- 239000012847 fine chemical Substances 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000003889 chemical engineering Methods 0.000 title claims abstract description 21
- 230000004927 fusion Effects 0.000 title abstract description 6
- 238000013507 mapping Methods 0.000 claims abstract description 46
- 230000003068 static effect Effects 0.000 claims abstract description 11
- 238000012544 monitoring process Methods 0.000 claims description 19
- 239000000126 substance Substances 0.000 claims description 10
- 238000012502 risk assessment Methods 0.000 claims description 8
- 238000012954 risk control Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims description 2
- 238000012805 post-processing Methods 0.000 claims description 2
- 230000010076 replication Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 abstract description 4
- 230000006872 improvement Effects 0.000 abstract description 3
- 238000013461 design Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000000383 hazardous chemical Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/0227—Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
- G05B23/0229—Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions knowledge based, e.g. expert systems; genetic algorithms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/4184—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by fault tolerance, reliability of production system
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0259—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
- G05B23/0267—Fault communication, e.g. human machine interface [HMI]
- G05B23/027—Alarm generation, e.g. communication protocol; Forms of alarm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2223/00—Indexing scheme associated with group G05B23/00
- G05B2223/02—Indirect monitoring, e.g. monitoring production to detect faults of a system
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Automation & Control Theory (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Manufacturing & Machinery (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于知识图谱中的知识抽取领域,提供了一种基于虚拟知识图谱的精细化工安全生产数据融合与重构方法。本发明针对精细化工的安全生产数据特点,即结构化数据众多、数据库多源异构、时序逻辑强等问题,创新性地提出利用虚拟知识图谱的方法完成对精细化工传统数据库的融合和重构。具体地是在不增加原数据库存储规模的基础上,从更贴近人类逻辑的角度重构数据库,从而独立底层数据库的逻辑模式和存储方式,更加方便清晰地访问多源数据库。本发明首次将精细化工领域的静态结构化知识与化工安全生产的实时动态数据库在本体概念上进行融合,以实体的形式组织时序数据。并对现有的OBDA系统的映射规则进行基于本发明的数据集的改进。
Description
技术领域
本发明属于知识图谱中的知识抽取(Knowledge Extraction)领域,面向精细化工安全生产的大量结构化数据库和多源异构的知识数据表,提出基于虚拟知识图谱的数据融合与重构方法,打通化工企业的知识数据孤岛,通过“黑箱”封装数据库结构,在本体概念层对数据进行融合和重构。
背景技术
(1)精细化工安全生产数据现状
精细化学品的安全生产数据具有来源多样、结构复杂、访问难度大的特点。第一,数据来源多样,包括仪表测量、图像监测、故障库、故障追踪报告、安检报告、安全状态分析等,广泛存在于生产、质量、库存、维护、能耗等环节中;第二,精细化工的传统数据库与数据表格结构复杂多样,缺乏统一的语义表达,数据孤岛现象严重;第三,用户访问现有的数据库系统,需要大量数据库技术以及底层物理存储知识作为支撑,用户友好性较低。
(2)虚拟知识图谱
虚拟知识图谱是一种在对数据库访问时,将数据库重构为虚拟的知识图谱视图,访问结束时消失的数据库重构技术,它的本质是一种面向结构化数据的知识抽取,将大量的异构结构化数据由传统的关系数据库映射到一个虚拟的基于本体的概念视图上。它是在传统的OBDA系统上针对时序数据库的一种改进,一个典型的OBDA系统由本体、数据源以及映射三部分组成,可以表示为一个三元组O=<T,S,M>的形式。
T也称为TBox,描述图数据库中节点和边的定义以及它们的逻辑关系。
S表示传统的关系数据库,在精细化工行业中定义为如DCS等数据库以及一些静态的结构化安全知识表。
M是Mapping的缩写,表示为Q(S)→Q(O),其中Q(S)表示在传统的关系数据库上进行的查询,返回的是S上的一个关系视图。Q(O)表示在知识图谱上进行的查询,返回的是图谱O上的一个子图。
与传统的OBDA系统只含有静态数据库不同的是,精细化工行业的结构化数据库是静态数据库与动态数据库的结合。需要实时更新映射规则,实时生成基于虚拟知识图谱的动态数据视图。
在该视图中,将精细化工的孤立数据库联合,重构为一个更加符合人类思维的本体图,从而向下独立于底层的异构数据库而“虚拟存在”。目前已经有一些标准和工具支持将传统数据库数据转化为知识图谱的RDF数据、OWL本体等。W3C的RDB2RDF工作组于2012年发布了两个推荐的RDB2RDF映射语言:DM(Direct Mapping,直接映射)和R2RML,DM和R2RML映射语言用于定义关系数据库中的数据如何转化为RDF数据的各种规则,具体包括URI的生成、RDF类和属性的定义、空节点的处理、数据间关联关系的表达等。
本发明基于精细化工安全生产过程大量多源异构的结构化数据库和数据表,发现了数据的结构特点和数据组织形式,提出了基于虚拟知识图谱的结构化数据库融合与重构方法,打通精细化工安全生产的结构化数据,实现了底层数据库的图形式重构。
发明内容
本发明的目的是针对精细化工的安全生产数据特点,即结构化数据众多、数据库多源异构、时序逻辑强等问题,创新性地提出利用虚拟知识图谱的方法完成对精细化工传统数据库的融合和重构。具体地是在不增加原数据库存储规模的基础上,从更贴近人类逻辑的角度重构数据库,从而独立底层数据库的逻辑模式和存储方式,更加方便清晰地访问多源数据库。
本发明的技术方案:
一种基于虚拟知识图谱的精细化工安全生产数据融合与重构方法,包括以下步骤:
步骤1:构建精细化工安全生产结构化知识数据集
精细化工安全生产结构化知识数据集主要来自以下两个方面,并且使用该技术的单位可按照本单位的数据库访问需求和底层数据的物理组织形式重新规划数据集;
(1)动态变化的实时数据库
主要由来自传感器的时序数据集和来自操作工的班组日志集构成;
①来自传感器的时序数据集
传感器采集的实时变化的监控数据由DCS系统(Distributed Control System,分布式控制系统)集中处理并存入DCS数据库,再分发给位于DCS数据库上层的其他数据应用系统,从而实现对监控数据的按需访问;
②来自操作工的班组日志集
操作工的班组日志集包括接班情况、本班情况和交班情况三个方面,由负责人录入PMCI数据库中;三个方面的数据包含主要检测位点在换班时刻的数据记录、操作员的操作记录、物料进出记录以及交接物品记录四种数据;与DCS系统的监控样点数据一样,班组日志数据也具有高度的时序性和动态变化性。
(2)静态存储的关系数据表
静态存储的关系数据表主要由主要生产设备表、精细化学品数据库、报警风险分析及控制措施表和SIS连锁控制方案表组成;
①主要生产设备表,包括设备、位号以及设备的温度压力范围;
②精细化学品数据库,包括物质辨识分类表、危险化学品辨识表以及主要危险化学品的理化特性数据表;这些数据来源于法律法规和行业标准,是DCS数据库的监控位点数据的有效补充,但目前二者并未有机结合。
③报警风险分析及控制措施表,分为DCS报警分析及控制措施集和SIS报警分析及控制措施集,主要描述检测位点的正常操作值、报警阈值和报警后处理措施;
④SIS连锁控制方案表是由安全联锁系统导出的,安全联锁系统能实现一个或多个安全功能的系统,用于监视生产装置或独立单元的操作;如果生产过程超出安全操作范围,安全联锁系统使其进入安全状态,确保生产装置或独立单元的安全;安全联锁系统是基于PID控制的逻辑运算集,SIS连锁控制方案表则是这些控制逻辑和规则的集成,用于表示设备、位号之间的一种基于安全生产的互联关系;
步骤2:构建OWL2 QL本体集
第一,由于精细化工行业是一个典型的过程工艺行业,安全生产数据大多基于传感器采集的数据进行处理并做出响应。第二,虚拟知识图谱是基于物理存储的数据库,形成的包含时序数据的一个子视图,它更接近人类思维,方便工作人员在不了解底层数据库和其他数据表的情况下,快速获取数据和相关联的安全生产知识、规则。
选用OWL2 QL语言构建本体,它有以下几个方面的特点:
①语言设计简单,便于设计多源异构数据库的本体层次;
②查询复杂度为AC0,非常适合大规模数据,更适合对DCS数据库进行数据访问和处理。
(1)确定本体
通过对数据集特点的梳理,构建一个包含顶层本体和下层本体的梯度结构本体层次;其中,
顶层本体为各实时动态数据库或静态知识数据表;
下层本体为各结构化数据库的非属性字段;
(2)确定本体关系
顶层本体和下层本体之间满足如下关系:
下层本体是顶层本体的一个子类,继承顶层本体的所有属性;
下层本体的关系和属性会被该下层本体下的所有实体所继承,这些实体在数据集当中具体表示为每一个时刻下的动态时序数据库或静态知识数据库的记录;
步骤3:设计R2RML映射规则
在下层本体下,将具体的结构化记录作为实体。将DCS系统作为核心数据库与其他数据库或者数据表发生关联,DCS的每一个监控位点作为主键。该过程的本质是将传感器位点监控的物理量与其他知识数据库(危化品数据库,生产设备表监控位点,报警风险分析及控制措施表等)发生关联。当员工按照需求访问数据库时,只需输入所需查询条件,例如监控物理量的时间和内容等,即可获得融合其他相关知识库知识并重构成的一个“虚拟”的数据库图形视图。
RDF是一种资源描述框架,它由<主,谓,宾>构成,由本体理论做支撑,更加接近人类思维。
与传统的DM映射语言不同的是,R2RML映射语言可以按照用户需求动态地生成所需要的RDF数据,再将这些RDF数据合并相同的主语、宾语为一个图视图当中的图节点,最终组成图结构视图。由于该过程只涉及用户需要访问的那部分数据,故这种方法是在源数据库上实现的部分重构,而不是全部复现。针对于精细化工安全生产的大量结构化数据,尤其是不停迭代产生的时序数据,我们采用R2RML语言,并且在原始R2RML语言的基础上加入“时间约束”,即按照用户需求准确调用某一时间段,或者以某一事件为节点的时间段内的监控数据,并返回给用户相关联的其他数据库知识数据。
采用R2RML的自定义映射语言并加以改进,改进后的映射规则如下:
①数据库的表映射为RDF顶层本体类;
②数据库中表的列字段中:文字或符号类的数据(例如故障原因,故障后果,监控位点等)映射为RDF下层本体类;
③数据库中表的列字段中:数字类的数据(例如温度限、压力限、正常操作值等)定义为该行主键的一个属性;
④数据库表中每一个字段的每一行中:文字或符号类的数据定义为一个实体;
⑤除DCS数据库的数据库表中每一个字段的每一行中:数字类的数据定义为该行主键的一个属性值;
⑥DCS数据库的每一个时刻的每一个位点下的数据作为一个实体;
⑦如果单元格是文字或符号类数据,并且对应其他数据库表的一个外键,则将其替换为外键值所指向的实体;
即一个主语映射和多个谓词-宾语映射;主语映射从逻辑表生成所有的RDF三元组中的主语,即选取主键作为三元组主语;谓词-宾语映射包含了谓词映射和宾语映射。
本发明的有益结果:
(1)方法的创新
本发明首次将精细化工领域的静态结构化知识与化工安全生产的实时动态数据库在本体概念上进行融合,以实体的形式组织时序数据。并对现有的OBDA系统的映射规则进行基于本发明的数据集的改进。
(2)虚拟知识图谱的存储开销
虚拟知识图谱的本质是基于原结构化数据库链接后重构的图结构视图。它本身不占用物理存储空间,只有在用户进行对数据库进行访问时才形成,访问结束消失。虚拟知识图谱有以下几个好处:第一,开发方便,在开发虚拟知识图谱的应用时不需要重新搭建一个数据库,只需要在数据访问形式和组织形式上进行改变即可;第二,数据安全,在用户对数据库进行访问时,只涉及了用户需要的数据,并没有将全部数据展现给用户。另外,虚拟知识图谱相比于图数据库而言,它不会额外产生原关系数据库的副本,大大提升数据的安全性。
(3)前景广阔
知识图谱是一种在各应用场景下兴起的数据组织技术。它对于新一代人工智能有很大的借鉴意义。另外知识图谱可以融合大量多源异构数据,从而基于大数据完成预测,推理,问答等各种应用任务。在精细化工领域,结构化数据形成的虚拟知识图谱还可以结合文本信息,厂区监控信息,设备的音视频监控信息,深度理解其中的语义,进行更深的应用研究。
附图说明
图1为构建精细化工安全生产虚拟知识图谱的架构图。
图2为虚拟知识图谱的本体层次设计图。
图3为DCS数据库的单位点、单时刻下的虚拟图谱示例。
具体实施方法
下面结合附图和技术方案,进一步说明本发明的具体实施方式。
本发明所用的数据是精细化工行业常见的结构化数据,由于我们面向的问题是精细化工行业的生产安全,不是全部的结构化数据。故基于该问题,收集整理了包括实时动态变化的结构化数据,静态知识数据表在内的共六种数据源。数据的组织形式都是传统关系数据库,展现给用户的样式是如下方所示的数据表视图。
精细化工安全生产问题的核心是传感器数据的实时监控,异常报警,故障溯源以及报警处理方案。基于此,首先利用OWL2 QL语言进行本体建模,将本体划分为顶层本体和下层本体。数据源的表名作为顶层本体,表名下方的字段名作为下层本体或属性。
以上述DCS数据库的一行数据,即1个时间点下的3个传感器数据,和报警风险分析及控制措施表为例。以下为两类数据得到的三元组表示方法。
<http://data.FineChemicalSafetyProduction.com/DCS/2021.12.01.08.00.00>rdf:type ex:TIME.
<http://data.FineChemicalSafetyProduction.com/DCS/50>rdf:type ex:TA001.
<http://data.FineChemicalSafetyProduction.com/DCS/60>rdf:type ex:PA001.
<http://data.FineChemicalSafetyProduction.com/DCS/70>rdf:type ex:LA001.
<http://data.FineChemicalSafetyProduction.com/DCS/2021.12.01.08.00.00>ex:TA001is“50”.
<http://data.FineChemicalSafetyProduction.com/DCS/2021.12.01.08.00.00>ex:PA001is“60”.
<http://data.FineChemicalSafetyProduction.com/DCS/2021.12.01.08.00.00>ex:LA001is“100”.
<http://data.FineChemicalSafetyProduction.com/DCS/50>ex:AlarmRiskAnalysis<http://data.FineChemicalSafetyProduction.com/AlarmRiskAnalysis/LA001>
<http://data.FineChemicalSafetyProduction.com/AlarmRiskAnalysis/LA001>rdf:type ex:TagNumber.
<http://data.FineChemicalSafetyProduction.com/AlarmRiskAnalysis/LA001>ex:Describe”Inlet Temperature and Pressure”.
<http://data.FineChemicalSafetyProduction.com/AlarmRiskAnalysis/LA001>ex:NormalOperatingValue“40-100”.
为了将传统的结构化时序数据和表格转化为上方的RDF三元组数据,我们需要创建两个映射文档。单个数据表的映射文档和多数据表链接的映射文档。
以DCS数据库为例,单数据表的R2RML映射文档如下所示:
以DCS数据库和报警风险分析及控制措施表的链接视图为例,多数据表链接的R2RML映射文档如下所示:
然后启动精细化工的结构化数据库,将本体的OWL文档,和R2RML映射文档经过API接口接入OBDA系统中。在不同的OBDA系统中,映射规则会有不同的编码。例如使用Ontop工具,用户需要访问某一天内的DCS数据,除上述的基本映射规则之外,还需要加入一个动态的虚拟本体,即当天的TA001数据,动态映射规则如下:
mappingId dcs-today’s TA001
target:Safety in production/dcs/{TA001}a:dcs-today’s TA001.
source SELECT TIME,TA001 FROM"DCS"
WHERE"TIME"(时间条件筛选)
最终,查询结果返回满足条件的三元组数据,以虚拟视图的形式呈现。
图1为构建精细化工安全生产虚拟知识图谱的架构图。分为三个模块,即底层数据收集模块,OWL本体设计模块和R2RML映射规则设计模块。原始的底层数据是互相独立的,使用OWL语言和Protégé本体开发工具进行本体建模,相同含义的数据作为一个本体,从而融合多源数据库。R2RML映射板块将数据库的横行数据映射为各本体下的实体,再从结构化数据库中选取实体的主键和外键,依据此完成映射规则的构建。
图2为本发明的本体层次设计图。通过梳理本发明所设计的数据库结构,采用自顶向下的方法进行本体层次划分。提取数据表的表名为顶层本体,数据表的非属性字段作为下层本体,属性字段作为实体的属性。当用户需要按条件访问数据库时,映射语言会创建虚拟本体来组织相关实体数据,访问结束撤销。
图3是基于DCS的2个时间点下的3个监测位点以及1个位点的报警风险分析和控制措施,将这些数据定义为虚拟视图中的节点,并定义节点之间的逻辑关系,然后构建的一个概念图示例。该图展示了虚拟知识图谱的逻辑关系,即构建实时动态变化的数据库数据与静态知识库数据的关联关系,返回给用户一个基于本体的关联多源数据库的虚拟视图。
Claims (1)
1.一种基于虚拟知识图谱的精细化工安全生产数据融合与重构方法,其特征在于,包括以下步骤:
步骤1:构建精细化工安全生产结构化知识数据集
精细化工安全生产结构化知识数据集主要来自以下两个方面:
(1)动态变化的实时数据库
主要由来自传感器的时序数据集和来自操作工的班组日志集构成;
①来自传感器的时序数据集
传感器采集的实时变化的监控数据由DCS系统集中处理并存入DCS数据库,再分发给位于DCS数据库上层的其他数据应用系统,从而实现对监控数据的按需访问;
②来自操作工的班组日志集
操作工的班组日志集包括接班情况、本班情况和交班情况三个方面,由负责人录入PMCI数据库中;三个方面的数据包含主要检测位点在换班时刻的数据记录、操作员的操作记录、物料进出记录以及交接物品记录四种数据;
(2)静态存储的关系数据表
静态存储的关系数据表主要由主要生产设备表、精细化学品数据库、报警风险分析及控制措施表和SIS连锁控制方案表组成;
①主要生产设备表,包括设备、位号以及设备的温度压力范围;
②精细化学品数据库,包括物质辨识分类表、危险化学品辨识表以及主要危险化学品的理化特性数据表;
③报警风险分析及控制措施表,分为DCS报警分析及控制措施集和SIS报警分析及控制措施集,主要描述检测位点的正常操作值、报警阈值和报警后处理措施;
④SIS连锁控制方案表是由安全联锁系统导出的,安全联锁系统能实现一个或多个安全功能的系统,用于监视生产装置或独立单元的操作;如果生产过程超出安全操作范围,安全联锁系统使其进入安全状态,确保生产装置或独立单元的安全;安全联锁系统是基于PID控制的逻辑运算集,SIS连锁控制方案表则是这些控制逻辑和规则的集成,用于表示设备、位号之间的一种基于安全生产的互联关系;
步骤2:构建OWL2 QL本体集
(1)确定本体
构建一个包含顶层本体和下层本体的梯度结构本体层次;其中,
顶层本体为各实时动态数据库或静态知识数据表;
下层本体为各结构化数据库的非属性字段;
(2)确定本体关系
顶层本体和下层本体之间满足如下关系:
下层本体是顶层本体的一个子类,继承顶层本体的所有属性;
下层本体的关系和属性会被该下层本体下的所有实体所继承,这些实体在数据集当中具体表示为每一个时刻下的动态时序数据库或静态知识数据库的记录;
步骤3:设计R2RML映射规则
在下层本体下,将具体的结构化记录作为实体,将DCS系统作为核心数据库与其他数据库或数据表发生关联,DCS系统的每一个监控位点作为主键;
R2RML映射语言按照用户需求动态地生成所需要的RDF数据,再将这些RDF数据合并相同的主语、宾语为一个图视图当中的图节点,最终组成图结构视图;由于该过程只涉及用户需要访问的那部分数据,故这种方法是在源数据库上实现的部分重构,而不是全部复现;针对于精细化工安全生产的大量结构化数据,尤其是不停迭代产生的时序数据,采用R2RML语言,并且在原始R2RML语言的基础上加入“时间约束”,即按照用户需求准确调用某一时间段,或者以某一事件为节点的时间段内的监控数据,并返回给用户相关联的其他数据库知识数据;
DM的直接映射规则如下:
①数据库的表映射为RDF类;
②数据库中表的列映射为RDF属性;
③数据库表中每一行映射为一个三元组实体,创建IRI;
④数据库表中每一个单元格的值映射为一个文字值;如果单元格的值对应一个外键,则将其替换为外键值指向的资源或实体的IRI;
采用R2RML的自定义映射语言并加以改进,改进后的映射规则如下:
①数据库的表映射为RDF顶层本体类;
②数据库中表的列字段中:文字或符号类的数据映射为RDF下层本体类;
③数据库中表的列字段中:数字类的数据定义为该行主键的一个属性;
④数据库表中每一个字段的每一行中:文字或符号类的数据定义为一个实体;
⑤除DCS数据库的数据库表中每一个字段的每一行中:数字类的数据定义为该行主键的一个属性值;
⑥DCS数据库的每一个时刻的每一个位点下的数据作为一个实体;
⑦如果单元格是文字或符号类数据,并且对应其他数据库表的一个外键,则将其替换为外键值所指向的实体;
即一个主语映射和多个谓词-宾语映射;主语映射从逻辑表生成所有的RDF三元组中的主语,即选取主键作为三元组主语;谓词-宾语映射包含了谓词映射和宾语映射。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210099893.4A CN114547168B (zh) | 2022-01-27 | 2022-01-27 | 基于虚拟知识图谱的精细化工安全生产数据融合与重构方法 |
US17/992,791 US20230236587A1 (en) | 2022-01-27 | 2022-11-22 | Data fusion and reconstruction method for fine chemical industry safety production based on virtual knowledge graph |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210099893.4A CN114547168B (zh) | 2022-01-27 | 2022-01-27 | 基于虚拟知识图谱的精细化工安全生产数据融合与重构方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114547168A CN114547168A (zh) | 2022-05-27 |
CN114547168B true CN114547168B (zh) | 2022-09-20 |
Family
ID=81672671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210099893.4A Active CN114547168B (zh) | 2022-01-27 | 2022-01-27 | 基于虚拟知识图谱的精细化工安全生产数据融合与重构方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230236587A1 (zh) |
CN (1) | CN114547168B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115829034B (zh) * | 2023-01-09 | 2023-05-30 | 白杨时代(北京)科技有限公司 | 一种构建知识规则执行框架的方法及装置 |
CN115794967B (zh) * | 2023-01-30 | 2023-07-21 | 北京大数据先进技术研究院 | 关系数据映射与语义本体同步生成方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN113297252A (zh) * | 2021-05-28 | 2021-08-24 | 北京信息科技大学 | 一种模式无感知的数据查询服务方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11636123B2 (en) * | 2018-10-05 | 2023-04-25 | Accenture Global Solutions Limited | Density-based computation for information discovery in knowledge graphs |
US10970278B2 (en) * | 2019-03-29 | 2021-04-06 | Microsoft Technology Licensing, Llc | Querying knowledge graph with natural language input |
CN111428048A (zh) * | 2020-03-20 | 2020-07-17 | 厦门渊亭信息科技有限公司 | 一种基于人工智能的跨领域知识图谱构建方法及装置 |
CN111444351B (zh) * | 2020-03-24 | 2023-09-12 | 清华苏州环境创新研究院 | 一种行业工艺领域知识图谱构建方法及装置 |
-
2022
- 2022-01-27 CN CN202210099893.4A patent/CN114547168B/zh active Active
- 2022-11-22 US US17/992,791 patent/US20230236587A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN113297252A (zh) * | 2021-05-28 | 2021-08-24 | 北京信息科技大学 | 一种模式无感知的数据查询服务方法 |
Non-Patent Citations (2)
Title |
---|
development of process safety knowledge graph:a case study on delayed coking process;shai mao 等;《computers & chemical engineering》;20201205;第143卷;1-8 * |
基于Neo4j的化工安全知识图谱构建研究;黑龙江科学;《黑龙江科学》;20210831;第12卷(第16期);17-19 * |
Also Published As
Publication number | Publication date |
---|---|
US20230236587A1 (en) | 2023-07-27 |
CN114547168A (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114547168B (zh) | 基于虚拟知识图谱的精细化工安全生产数据融合与重构方法 | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台系统 | |
CN115080765A (zh) | 一种航天质量知识图谱构建方法、系统、介质和设备 | |
Yang et al. | Multi-source heterogeneous information fusion of power assets based on knowledge graph | |
Louhdi et al. | Transformation rules for building owl ontologies from relational databases | |
Huang et al. | Identification of data mining research frontier based on conference papers | |
Pei et al. | Construction of curriculum knowledge map based on ontology | |
Umer et al. | Semantically intelligent semi-automated ontology integration | |
Ren et al. | Analysis on the construction of knowledge graph of mass events based on ontology | |
Menendez-Gonzalez et al. | Olap navigation in the granular linguistic model of a phenomenon | |
CN112784129A (zh) | 一种泵站设备运维数据监管平台 | |
Li et al. | Distributed processing of spatiotemporal ocean data: a survey | |
Meng et al. | Design and Implementation of Knowledge Graph Platform of Power Marketing | |
Gu et al. | A Novel Approach for Constructing Intangible Cultural Heritage Knowledge Graphs | |
Yang et al. | Construction of knowledge graph in the field of grassland plants based on ontology database | |
Pu et al. | Migration knowledge graph framework and its application | |
CN117934209B (zh) | 一种基于知识图谱的区域电力系统碳排放大数据分析方法 | |
Helal et al. | Patent Mining by Extracting Functional Analysis Information Modelled As Graph Structure: A Patent Knowledge-base Collaborative Building Approach | |
Li et al. | Distributed Processing of Ocean Spatiotemporal Data: A Survey | |
Wang et al. | Construction and Application of Knowledge Graph for Aerospace Product Quality Problems | |
EL BOUHISSI et al. | 16 Toward Data Integration | |
Qian | Research on Construction Method of Science and Technology Service Domain Knowledge Map | |
Liu et al. | Visualization Research of People's Livelihood Service Data based on Knowledge Graph | |
Wang et al. | Research on Construction Technology of Multi Heterogeneous Data Resource Graph of Power Grid Corporation | |
Yang et al. | Reconstruction of ER Network from Specific Academic Texts for the Governance of MSW-NIMBY Crisis in China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |