CN116244443A - 一种基于知识图谱的超声波燃气表节点故障诊断方法 - Google Patents
一种基于知识图谱的超声波燃气表节点故障诊断方法 Download PDFInfo
- Publication number
- CN116244443A CN116244443A CN202211106039.2A CN202211106039A CN116244443A CN 116244443 A CN116244443 A CN 116244443A CN 202211106039 A CN202211106039 A CN 202211106039A CN 116244443 A CN116244443 A CN 116244443A
- Authority
- CN
- China
- Prior art keywords
- gas meter
- node
- path
- ultrasonic gas
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000003745 diagnosis Methods 0.000 title claims abstract description 32
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 60
- 238000013508 migration Methods 0.000 claims abstract description 11
- 230000005012 migration Effects 0.000 claims abstract description 11
- 238000012163 sequencing technique Methods 0.000 claims abstract description 11
- 230000004927 fusion Effects 0.000 claims abstract description 6
- 239000007789 gas Substances 0.000 claims description 244
- 230000006870 function Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 19
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 10
- 238000005295 random walk Methods 0.000 claims description 9
- 239000003345 natural gas Substances 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000007477 logistic regression Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000005192 partition Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 9
- 238000010276 construction Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 4
- 239000000306 component Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000004026 adhesive bonding Methods 0.000 description 3
- 238000013178 mathematical model Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- WABPQHHGFIMREM-UHFFFAOYSA-N lead(0) Chemical compound [Pb] WABPQHHGFIMREM-UHFFFAOYSA-N 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 239000012533 medium component Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 235000012431 wafers Nutrition 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Water Supply & Treatment (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Measuring Volume Flow (AREA)
Abstract
一种基于知识图谱的超声波燃气表节点故障诊断方法,包括:(1)从多个信息源采集超声波燃气表信息,提取超声波燃气表与计量参数三元组,构建数据支持层;(2)使用Falcon‑AO系统将步骤(1)所得数据支持层中的三元组进行知识融合,得到一个去冗余的超声波燃气表图谱;(3)用路径排序算法(Path Ranking Algorithm,PRA)对步骤(2)所得超声波燃气表图谱进行知识推理,补全步骤(2)所得图谱中缺少的实体节点;(4)利用步骤(3)构建的燃气表知识图谱,使用深度游走算法提取燃气表节点特征,进行超声波燃气表节点故障诊断。本发明构建超声波燃气表节点计量参数的知识图谱,提供现有超声波燃气表节点的更新后计量参数数据和新增超声波燃气表节点的故障诊断结果。
Description
技术领域
本发明涉及超声波燃气表故障诊断领域,具体涉及一种基于知识图谱的超声波燃气表节点故障诊断系统及方法。
背景技术
超声波燃气表的关键组件包括换能器、流道和计量芯片等,同时管道内天然气介质成分较为复杂,部分情况下天然气中掺杂有水、油气、小颗粒固体杂质等物质。换能器由压电陶瓷晶片制作组成,它的外面还安装引线、壳体、前方的声匹配层和后方的削声层,以及各部件间的胶粘接层,这些部件和胶粘接层在燃气输送过程中处于恶劣环境,在超声波燃气表的额定使用寿命(一般6-9年)期间,极易在声匹配层粘上污染物。同时,由于部件和胶粘接层的性能劣化、老化或破坏,计量室体积缩小而产生误差变化,超声波燃气表的计量精度将会下降,甚至无法计量。
因此,需要使用故障诊断技术判断超声波燃气表的状态。当超声波燃气表无法正常工作时,及时发送故障信息提醒用户,并通过物联网等通信方式传送到燃气公司的管理后台告警,提醒燃气公司查看故障超声波燃气表,并进行修理或更换。
目前广泛的故障诊断技术总体上可分为三类:基于信号处理的方法、基于解析模型的方法以及基于知识图谱的智能故障诊断方法。基于信号处理的故障诊断方法利用函数和频谱等信号模型,提取出幅度、方差等特征值进行故障检测。在具体应用上,卢等人使用基于信号处理的方法对扬声器进行故障诊断,Deking等人使用基于信号处理的方法对卫星进行故障诊断。但是这类故障诊断方法无法很好地对故障进行具体描述,因此在一些情况下,使用基于解析模型的故障诊断方法是更优选择。基于解析模型的故障诊断方法以给定的诊断对象数学模型为基础,使用一定数学方法如参数估计法、等价空间法等,处理诊断对象信息。在具体应用上,Wang等人使用基于解析模型的方法对微电网进行故障诊断,Guo等人使用基于解析模型的方法对电力系统进行故障诊断。但是解析模型的故障诊断方法需要给定数学模型,同时这种诊断方法很难应用于非线性系统,因此在非线性系统中一般使用基于知识的智能故障诊断方法。基于知识的智能故障诊断方法在各类知识处理技术的基础上,对概念和处理方法进行知识化处理,实现系统的故障诊断。现有的基于知识的智能故障诊断方法存在判断具有延时性、无法及时预警、特征参数单一等问题。
因此,建立一种及时预警并且能依据多个特征参数进行故障诊断的超声波燃气表故障诊断方法是必要的。
发明内容
本发明要克服现有技术的上述缺点,提供一种基于知识图谱的超声波燃气表节点故障诊断方法,实现对有关超声波燃气表节点计量参数的知识图谱构建,提供对于现有超声波燃气表节点的更新后计量参数数据,以及新增超声波燃气表节点的故障诊断结果。
本发明的一种基于知识图谱的超声波燃气表节点故障诊断方法,包括以下步骤:
(1)从多个信息源采集超声波燃气表信息,提取超声波燃气表与计量参数三元组,构建数据支持层。
1.1)由超声波燃气表计量参数相关的数据源提供计量参数数据。包括标准数据,实时数据以及历史数据。
其中标准数据由超声波燃气表企业数据库提供,包括采样幅值标准范围,声波标准传播时间,声波实时传播时间小于声波标准传播时间的时间阈值,天然气中的理论声速。
其中实时数据由超声波燃气表采集模块传感器提供,包括实时采样幅值,声波实时顺流传播时间,声波实时逆流传播时间,燃气实时流速。
其中历史数据由超声波燃气表控制模块提供,包括初始采样幅值,声波初始顺流传播时间,声波初始逆流传播时间,天然气中声波的实际计算声速。
1.2)构建超声波燃气表的关系数据库用于存储已获得的计量参数数据。从获得的分散数据中提取出超声波燃气表实体、属性以及实体间的相互关系,构建结构化的关系数据库。实体包括超声波燃气表;属性包括标准数据,实时数据和历史数据;实体间关系包括是否为同一型号,是否为同一属性。
1.3)对已获取的数据进行整合,构建成超声波燃气表知识图谱的数据支持层。将关系数据库中的数据经过D2R(Database to RDF),转化到资源描述框架(ResourceDescription Framework,RDF)中,RDF中的类由关系数据库表名直接转化,类的属性由关系数据库中的字段直接转化,类之间关系从关系数据库中表示关系的表得到。使用Neo4j系统将转化后的数据以图的形式储存到超声波燃气表图数据库,每一三元组单元形式为:(头实体节点,关系,尾实体节点)。
(2)使用Falcon-AO系统将步骤(1)所得数据支持层中的三元组进行知识融合,得到一个去冗余的超声波燃气表图谱。
由于所得超声波燃气表图数据库中存在少量冗余的三元组,因此采用基于Java的自动本体匹配系统Falcon-AO合并相似度高的超声波燃气表节点。
首先使用基于分区的块匹配算法(Partition-based block matching,PBM)对完整的超声波燃气表图谱基于距离进行分块,其次使用语言学算法I-Sub进行基于字符串编辑距离的匹配,以及使用语言学算法语言匹配(Linguistic matching,V-Doc)进行基于相似度的本体匹配,然后将前两者结果作为外部比对结果输入结构学算法结构匹配(Structural matching,GMO)进行进一步比对,最后连带前面两者的输出使用贪心算法进行选取,对最终选出的对齐实体节点进行合并,得到一个去冗余的超声波燃气表图谱。
(3)用路径排序算法(Path Ranking Algorithm,PRA)对步骤(2)所得超声波燃气表图谱进行知识推理,补全步骤(2)所得图谱中缺少的实体节点。
将所得知识图谱中超声波燃气表三元组(头实体节点,关系,尾实体节点)简记为(h,r,t)。节点包括燃气表实体节点、燃气表计量参数节点、计量参数数据节点,以下统称燃气表节点。在推理补全过程中有两种情况:第一种为给定燃气表头节点h和关系h来预测燃气表尾节点t;第二种为利用燃气表尾节点t和关系h预测燃气表头节点h。
所属算法将知识图谱中的路径作为实体间特征,并且通过根据超声波燃气表节点图计算对每个路径赋予相应的特征值,再利用这些特征进行逻辑回归,建立排序模型,根据模型选出的三元组进行补全,最终得到补全的燃气表知识图谱。
3.1)利用随机游走的路径排序算法生成步骤(2)燃气表图谱路径特征,由一系列超声波燃气表知识图谱中的关系生成一个路径P:
其中Tn是燃气表节点,为关系rn实体节点类型作用域,以及关系rn-1的实体节点类型值域。定义Tn=range(rn)函数表示Tn为关系rn的实体节点类型作用域,Tn=domain(rn-1)函数表示为关系rn-1的实体节点类型值域,此时Tn即为关系rn实体节点类型作用域又为关系rn-1的实体节点类型值域,即:
Tn=range(rn)=domain(rn-1) (2)
定义路径P的特征值Sh,P(t),此特征值表示沿着路径P,从燃气表头实体节点h开始能够到达燃气表尾实体节点t的概率。开始游走前,对该特征值进行初始化:
沿路径P游走过程中,每沿着路径游走到一个节点,特征值Sh,P(t)更新一次,更新公式为:
其中tn表示游走过程中遇到的第n个燃气表尾实体节点,P'表示路径P中已经游走过部分的路径,t'为路径P'中的燃气表尾节点,r'是路径P'中与燃气表尾节点t'相连的关系,此时Sh,P(tn)表示游走过程中到达各尾结点时的特征值与概率卷积的求和。其中P(t|t';r')表示从t'节点出发,沿着关系r'游走一步就可以达到节点t的概率:
其中t'是从燃气表尾实体节点t出发下一步可以达到的尾实体节点,r'(t',t)表示从燃气表节点t'出发,游走一步就可以达到节点t的关系为r'。r”(t',t")表示从t'节点出发,游走一步就可以达到其他节点t"的全部关系r”。
随机游走过程中,PRA在特征值得到初始化时以及特征值的更新迭代过程中,引入了对有效路径特征的约束条件,无效路径的计算结果为0。可以有效的减小搜索空间。
3.2)通过随机游走得到一系列燃气表图谱路径特征后,生成路径特征集Fr=(F1,F2,F3,...,Fn),PRA利用这些特征为燃气表图谱中任意关系r训练一个线性预测试的排序模型。
Fr中的每个特征Fn对应一个特征值其中Pn为生成该特征值的路径,h为该路径头结点,t为该路径中的尾结点。因此,特征集Fr对应一个路径集Pr=(P1,P2,P3,...,Pn)。Fr中的每个训练样本,即每对燃气表头实体节点h和燃气表尾实体节点t的组合的得分计算如下:
其中Pi中的i表示Pi是路径集Pr的第i个样本路径,Pr是特征集Fr对应的路径集。
根据每个样本路径的得分,我们可以通过一个逻辑回归函数得到每一个样本路径Pi的概率pi(r=1∣score(hi,ti))为:
其中exp(score(hi,ti))表示以自然常数e为底,score(hi,ti)为指数的指数函数,其中score(hi,ti)表示燃气表头实体结点为hi、燃气表尾实体结点为ti的组合对应样本路径的得分。头节点hi与尾节点ti组合对应的样本路径为Pi,pi中的i表示概率pi对应路径Pi。
将概率pi(r=1∣score(hi,ti))通过线性变换加上最大似然估计,得到损失函数如下:
li=yilnpi+(1-yi)ln(1-pi) (8)
其中pi表示路径Pi对应组合样本的概率,其中yi表示hi,ti是否为关系r的头实体节点与尾实体节点,若存在(hi,r,ti),则yi=1否则yi=0。li中的i表示li对应概率pi。
依据概率pi以及损失函数li对关系r进行线性预测试,在给定燃气表头节点h和关系h时,预测燃气表尾节点t;在给定燃气表尾节点t和关系h时,预测燃气表头节点h。预测时选取对应概率较大的三元组,当概率相近时,则选择损失函数较小的三元组。最终得到补全缺失的节点的燃气表知识图谱。
(4)利用步骤(3)构建的燃气表知识图谱,使用深度游走算法提取燃气表节点特征,进行超声波燃气表节点故障诊断。
4.1)对于已建立的超声波燃气表节点,使用深度游走算法提取燃气表节点特征,快速判断更新后数据是否异常,以此诊断超声波燃气表是否故障。
4.1.1)使用深度游走算法提取燃气表知识图谱中采样幅值标准范围节点的特征值范围,其中A0为节点特征值最小值,B0为节点特征值最大值。使用同样方法提取实时采样幅值节点的特征Cm,max,和标准范围节点值(A0,B0)进行比较,如果后比较结果为:Cm,max<A0,则判断超声波燃气表节点出现故障。
4.1.2)使用深度游走算法提取燃气表知识图谱中实时顺流传播时间节点的特征值tm,down、实时逆流传播时间节点的特征值tm,up、燃气流速节点的特征值vm和时间阈值节点的特征值Δt。当燃气流速特征值vm=0时,当tm,down=tm,up与t0,down=t0,up之间的差值达到Δt时,则判断超声波燃气表节点出现故障。
4.2)对于新建立的超声波燃气表节点通过步骤(3)中得到特征集Fr对新增节点进行数据推测。推测后提取燃气表节点特征值x,与知识图谱内标准节点特征值x0比较,计算推理数据误差如果E(x)大于设定标准值,则诊断超声波燃气表节点出现故障。
本发明的优点是:没有延时性、可以根据实时更新的超声波燃气表知识图谱及时预警;特征参数单多样,可根据多种超声波燃气表知识图谱节点的特征判断超声波燃气表工作状态。
附图说明
图1为超声波燃气表知识图谱构建流程图。
图2为Falcon-AO系统进行燃气表知识融合的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
下面结合附图对本发明做进一步详细阐述。
依照图1至图2,一种基于知识图谱的超声波燃气表节点故障诊断方法,包括下述几个步骤:
(1)构建燃气表数据支持层。从多个信息源采集超声波燃气表信息,提取超声波燃气表与计量参数三元组。
1.1)由超声波燃气表计量参数相关的数据源提供计量参数数据,包括标准数据,实时数据,历史数据。
1.1.1)其中标准数据由超声波燃气表企业数据库提供,以保证数据可靠性,包括采样幅值标准范围,声波标准传播时间范围值,声波实时传播时间小于声波标准传播时间的时间阈值,天然气中的理论声速,以及各数据存在的标注误差。该部分数据用于判断超声波燃气表更新后属性值是否正常,进一步判断燃气表节点工作状态是否正常。
1.1.2)其中实时数据由超声波燃气表的采集模块以及传感器提供,包括实时采样幅值,声波实时顺流传播时间,声波实时逆流传播时间,燃气实时流速,温度,压强。该部分数据用于超声波燃气表知识图谱的更新,以保证知识图谱的时效性。
1.1.3)其中历史数据由超声波燃气表控制模块提供,包括初始采样幅值,声波初始顺流传播时间,声波初始逆流传播时间,天然气中声波的实际计算声速。该部分数据用于初始超声波燃气表知识图谱的构建,以及对于新建立超声波燃气表节点的数据推理,进一步用于判断新建立超声波燃气表节点的工作状态是否正常。
1.2)构建超声波燃气表的关系数据库用于存储已获得的计量参数数据。
对于获得的结构化数据如数据库,超声波燃气表的计量参数存放形式一般为按照(参数名,参数值)存储的结构性数据库,但不同计量参数分开存储,缺少参数与参数、参数与燃气表、燃气表与燃气表间关系。因此需要对参数与参数、参数与燃气表、燃气表与燃气表间关系进行声明。一般安放形式为(参数名,关系,参数值)。
对于获得的半结构化和非结构化数据如工单、文字说明等,需要经过属性抽取、实体抽取、关系抽取,提取出超声波燃气表实体、属性以及实体间的相互关系,构建结构化的关系数据库。实体包括超声波燃气表;属性包括标准参数数据,实时参数数据和历史参数数据;实体间关系包括是否为同一型号,是否同一批次安装。
1.3)对已获取的数据进行整合转化,构建成超声波燃气表知识图谱的数据支持层。关系数据库中的数据分两种形式储存,一种是将关系数据库中的数据经过D2R,转化到RDF(资源描述框架)中,RDF中的类由关系数据库表名直接转化,类的属性由关系数据库中的字段直接转化,类之间关系从关系数据库中表示关系的表得到。基于RDF形式储存的知识图谱易于发布与共享图谱数据,但不适用于工业生产环境,同时后续处理在图结构下更为高效,因此还需要使用Neo4j系统再将关系数据库的数据以图的形式储存到超声波燃气表图数据库,使用具体形式为:(头实体节点,关系,尾实体节点)。所得到的图数据库即为所需的数据支持层。
(2)图1中的(b)知识融合步骤。如图2所示,使用Falcon-AO将步骤(1)所得数据支持层中的三元组进行本体匹配对齐,合并相同节点,得到一个去冗余的超声波燃气表知识图谱。
知识图谱主要分为自顶向下和自底向上两种构建技术。自顶向下的构建技术一般从百科类网站等获取结构化数据,从高质量数据中提取本体和模式信息,确定信息模式后构建图库。而自底向上的构建技术,则是通过一些技术手段,从公开数据中提取出资源模式,选择其中部分置信度较高的知识,构建图库。
本方法使用自顶向下的构建技术,该构建方式下数据噪声较小,所得超声波燃气表图数据库中仅存在少量冗余的三元组,因此采用基于Java的自动本体匹配系统Falcon-AO合并相似度高的超声波燃气表节点,以达到去冗余的效果。
Falcon-AO系统的匹配算法库使用四种算法,包括基于虚拟文档的语言学匹配,将实体及其周围的实体、文本等信息作为一个集合形成虚拟文档的V-Doc算法;基于编辑距离的字符串匹配的I-Sub算法;基于本体RDF图结构的匹配的GMO算法以及基于分而治之思想的大本体匹配的PBM算法。
2.1)成规模的大量超声波燃气表三元组经过PBM算法分散为块便于后续处理。PBM首先会把总领域的全部实体基于他们的结构化距离划分为一些小集群,然后将RDF语句分配给集群,通过该方式来构建块状集群,例如在类层级结构中类之间的距离以及领域属性之间的重叠。RDF资源描述可以提供比RDF语句更完整的句法和语义结构,因为它们可以将空白节点封装到其中。
数据支持层的超声波燃气表三元组由于其较为庞大的规模和形式单一的特点,会给现有的本体匹配系统带来较为巨大的挑战。因此PBM使用一种分而治之的方法来查找大规模本体节点之间的映射。
所述方式有主要两点优势:第一,它能避免我们的匹配系统泄露内存数据,分块后只取部分图谱进行本体匹配;第二,它能在不损害本体对齐结果质量的情况下缩短执行时间。当输入过少,只有一个或两个输入数据时,很可能大部分不具有匹配的对应项,进而导致输出结果质量低下。而输入过多数据即分块较大的情况下,则需要更长的本体匹配时间。
2.2)燃气表三元组块通过I-Sub预先找到的对齐锚点匹配,再经过V-Doc算法,使用语言学方法进行本体匹配。
所述I-Sub算法也采用语言学方法,但不同于之处在于,I-Sub算法是基于编辑距离的字符串匹配方法,而V-Doc算法通过构造虚拟文档进行匹配。V-Doc算法将输入燃气表三元组中的类或属性构建成的虚拟文档,作为权重词的集合,不仅基本上包含所有的局部描述,同时还包含反映目标燃气表三元组的周围实体的信息。建立完成后,采用传统向量空间的技术去计算文档相似度,进一步通过相似度相关的方法进行本体匹配。
2.3)将通过V-Doc算法的燃气表三元组块对输入GMO算法进行结构匹配,最后使用贪心算法合并结果,得到知识融合后的燃气表图谱。
经过V-Doc算法和I-Sub算法本体对齐后筛选出的高度相似的燃气表三元组块对作为GMO算法的输入。所述GMO算法采用递归传播二部图相似性的方式本体中RDF语句(即三元组)之间和计算不同块实体之间和的结构相似性,逐步生成额外的比对作为输出。
最后连带I-Sub算法、V-Doc算法的输出使用贪心算法进行选取,保证每次的选取结果是局部最优,从而使最后得到的结果是全局最优,对最终选出的对齐实体节点进行合并,得到去冗余的燃气表图谱。
(3)图1中的(c)知识加工步骤。用PRA算法对步骤(2)所得超声波燃气表知识图谱进行图1中的知识推理,补全步骤(2)所得图谱中缺少的实体节点。
将所得知识图谱中三元组(头实体节点,关系,尾实体节点)简记为(h,r,t),在推理补全过程中有两种情况:第一种为给定头节点h和关系r来预测尾节点t;第二种为是利用尾节点t和关系r来预测头节点h。
将所得知识图谱中超声波燃气表三元组(头实体节点,关系,尾实体节点)简记为(h,r,t)。节点包括燃气表实体节点、燃气表计量参数节点、计量参数数据节点,以下统称燃气表节点。在推理补全过程中有两种情况:第一种为给定燃气表头节点h和关系h来预测燃气表尾节点t;第二种为利用燃气表尾节点t和关系h预测燃气表头节点h。
所属算法将知识图谱中的路径作为实体间特征,并且通过根据超声波燃气表节点图计算对每个路径赋予相应的特征值,再利用这些特征进行逻辑回归,建立排序模型。所述算法通过燃气表实体节点间路径特征的排序完成两种情况下的实体节点补全,对每一个关系的头实体节点预测任务和尾实体节点预测任务都分别单独训练一个排序模型,根据模型选出的三元组进行补全,最终得到补全的燃气表知识图谱。
3.1)利用随机游走的路径排序算法生成步骤(2)燃气表图谱路径特征,由一系列超声波燃气表知识图谱中的关系生成一个路径P:
其中Tn是燃气表节点,为关系rn实体节点类型作用域,以及关系rn-1的实体节点类型值域。定义Tn=range(rn)函数表示Tn为关系rn的实体节点类型作用域,Tn=domain(rn-1)函数表示为关系rn-1的实体节点类型值域,此时Tn即为关系rn实体节点类型作用域又为关系rn-1的实体节点类型值域,即:
Tn=range(rn)=domain(rn-1) (2)
定义路径P的特征值Sh,P(t),此特征值表示沿着路径P,从燃气表头实体节点h开始能够到达燃气表尾实体节点t的概率。开始游走前,对该特征值进行初始化:
沿路径P游走过程中,每沿着路径游走到一个节点,特征值Sh,P(t)更新一次,更新公式为:
其中tn表示游走过程中遇到的第n个燃气表尾实体节点,P'表示路径P中已经游走过部分的路径,t'为路径P'中的燃气表尾节点,r'是路径P'中与燃气表尾节点t'相连的关系,此时Sh,P(tn)表示游走过程中到达各尾结点时的特征值与概率卷积的求和。其中P(t|t';r')表示从t'节点出发,沿着关系r'游走一步就可以达到节点t的概率:
其中t'是从燃气表尾实体节点t出发下一步可以达到的尾实体节点,r'(t',t)表示从燃气表节点t'出发,游走一步就可以达到节点t的关系为r'。r”(t',t")表示从t'节点出发,游走一步就可以达到其他节点t"的全部关系r”。
随机游走过程中,PRA在特征值得到初始化时以及特征值的更新迭代过程中,引入了对有效路径特征的约束条件,无效路径的计算结果为0。可以有效的减小搜索空间。
3.2)通过随机游走得到一系列燃气表图谱路径特征后,生成路径特征集Fr=(F1,F2,F3,...,Fn),PRA利用这些特征为燃气表图谱中任意关系r训练一个线性预测试的排序模型。
其中Fr中的每个特征Fn对应一个特征值Sh,Pn(t),其中Pn为生成该特征值的路径,h为该路径头结点,t为该路径中的尾结点。因此,特征集Fr对应一个路径集Pr=(P1,P2,P3,...,Pn)。Fr中的每个训练样本,即每对燃气表头实体节点h和燃气表尾实体节点t的组合的得分计算如下:
其中Pi中的i表示Pi是路径集Pr的第i个样本路径,Pr是特征集Fr对应的路径集。
根据每个样本路径的得分,我们可以通过一个逻辑回归函数得到每一个样本路径Pi的概率pi(r=1∣score(hi,ti))为:
其中exp(score(hi,ti))表示以自然常数e为底,score(hi,ti)为指数的指数函数,其中score(hi,ti)表示燃气表头实体结点为hi、燃气表尾实体结点为ti的组合对应样本路径的得分。头节点hi与尾节点ti组合对应的样本路径为Pi,pi中的i表示概率pi对应路径Pi。
将概率pi(r=1∣score(hi,ti))通过线性变换加上最大似然估计,得到损失函数如下:
li=yilnpi+(1-yi)ln(1-pi) (8)
其中pi表示路径Pi对应组合样本的概率,其中yi表示hi,ti是否为关系r的头实体节点与尾实体节点,若存在(hi,r,ti),则yi=1否则yi=0。li中的i表示li对应概率pi。
依据概率pi以及损失函数li对关系r进行线性预测试,在给定燃气表头节点h和关系h时,预测燃气表尾节点t;在给定燃气表尾节点t和关系h时,预测燃气表头节点h。预测时选取对应概率较大的三元组,当概率相近时,则选择损失函数较小的三元组。最终得到补全缺失的节点的燃气表知识图谱。
3.3)PRA的适用场景有一定约束。对于带有常量,含有明显的语义信息,并且首尾不是闭合的路径无法被捕捉。其原因在于PRA中搜索的路径是由关系的值域和作用域构成的。超声波燃气表知识图谱不含有语义信息,数据干扰较少,知识推理中不会出现这个问题,但如果需要优化,可采用co-PRA算法。
4.1)对于已建立的超声波燃气表节点,使用深度游走算法提取燃气表节点特征,快速判断更新后数据是否异常,以此诊断超声波燃气表是否故障。
4.1.1)使用深度游走算法提取燃气表知识图谱中采样幅值标准范围节点的特征值范围,其中A0为节点特征值最小值,B0为节点特征值最大值。使用同样方法提取实时采样幅值节点的特征Cm,max,和标准范围节点值(A0,B0)进行比较,如果后比较结果为:Cm,max<A0,则判断超声波燃气表节点出现故障。
4.1.2)使用深度游走算法提取燃气表知识图谱中实时顺流传播时间节点的特征值tm,down、实时逆流传播时间节点的特征值tm,up、燃气流速节点的特征值vm和时间阈值节点的特征值Δt。当燃气流速特征值vm=0时,当tm,down=tm,up与t0,down=t0,up之间的差值达到Δt时,则判断超声波燃气表节点出现故障。
4.1.3)使用深度游走算法提取燃气表知识图谱中理论声速节点的特征值cm,f,实际计算声速节点的特征值c'm,f。当理论声速节点的特征值cm,f与实际计算声速节点的特征值c'm,f之间的差值达到阈值下限时,则判断超声波燃气表节点出现故障。
4.1.4)使用深度游走算法提取燃气表知识图谱中实时顺流传播时间的特征值tm,down和实时逆流传播时间节点的特征值tm,up,声波标准传播时间节点的特征值范围。当实时顺流传播时间节点的特征值tm,down和实时逆流传播时间节点的特征值tm,up不在特征值范围内,则判断为传播时间异常,诊断超声波燃气表节点出现故障。
Claims (1)
1.一种基于知识图谱的超声波燃气表节点故障诊断方法,包括以下步骤:
(1)从多个信息源采集超声波燃气表信息,提取超声波燃气表与计量参数三元组,构建数据支持层;
1.1)由超声波燃气表计量参数相关的数据源提供计量参数数据;包括标准数据,实时数据以及历史数据;
其中标准数据由超声波燃气表企业数据库提供,包括采样幅值标准范围,声波标准传播时间,声波实时传播时间小于声波标准传播时间的时间阈值,天然气中的理论声速;
其中实时数据由超声波燃气表采集模块传感器提供,包括实时采样幅值,声波实时顺流传播时间,声波实时逆流传播时间,燃气实时流速;
其中历史数据由超声波燃气表控制模块提供,包括初始采样幅值,声波初始顺流传播时间,声波初始逆流传播时间,天然气中声波的实际计算声速;
1.2)构建超声波燃气表的关系数据库用于存储已获得的计量参数数据;从获得的分散数据中提取出超声波燃气表实体、属性以及实体间的相互关系,构建结构化的关系数据库;实体包括超声波燃气表;属性包括标准数据,实时数据和历史数据;实体间关系包括是否为同一型号,是否为同一属性;
1.3)对已获取的数据进行整合,构建成超声波燃气表知识图谱的数据支持层;将关系数据库中的数据经过D2R(Database to RDF),转化到资源描述框架(ResourceDescription Framework,RDF)中,RDF中的类由关系数据库表名直接转化,类的属性由关系数据库中的字段直接转化,类之间关系从关系数据库中表示关系的表得到;使用Neo4j系统将转化后的数据以图的形式储存到超声波燃气表图数据库,每一三元组单元形式为:(头实体节点,关系,尾实体节点);
(2)使用Falcon-AO系统将步骤(1)所得数据支持层中的三元组进行知识融合,得到一个去冗余的超声波燃气表图谱;
由于所得超声波燃气表图数据库中存在少量冗余的三元组,因此采用基于Java的自动本体匹配系统Falcon-AO合并相似度高的超声波燃气表节点;
首先使用基于分区的块匹配算法(Partition-based block matching,PBM)对完整的超声波燃气表图谱基于距离进行分块,其次使用语言学算法I-Sub进行基于字符串编辑距离的匹配,以及使用语言学算法语言匹配(Linguistic matching,V-Doc)进行基于相似度的本体匹配,然后将前两者结果作为外部比对结果输入结构学算法结构匹配(Structuralmatching,GMO)进行进一步比对,最后连带前面两者的输出使用贪心算法进行选取,对最终选出的对齐实体节点进行合并,得到一个去冗余的超声波燃气表图谱;
(3)用路径排序算法(Path Ranking Algorithm,PRA)对步骤(2)所得超声波燃气表图谱进行知识推理,补全步骤(2)所得图谱中缺少的实体节点;
将所得知识图谱中超声波燃气表三元组(头实体节点,关系,尾实体节点)简记为(h,r,t);节点包括燃气表实体节点、燃气表计量参数节点、计量参数数据节点,以下统称燃气表节点;在推理补全过程中有两种情况:第一种为给定燃气表头节点h和关系h来预测燃气表尾节点t;第二种为利用燃气表尾节点t和关系h预测燃气表头节点h;
所属算法将知识图谱中的路径作为实体间特征,并且通过根据超声波燃气表节点图计算对每个路径赋予相应的特征值,再利用这些特征进行逻辑回归,建立排序模型,根据模型选出的三元组进行补全,最终得到补全的燃气表知识图谱;
3.1)利用随机游走的路径排序算法生成步骤(2)燃气表图谱路径特征,由一系列超声波燃气表知识图谱中的关系生成一个路径P:
其中Tn是燃气表节点,为关系rn实体节点类型作用域,以及关系rn-1的实体节点类型值域;定义Tn=range(rn)函数表示Tn为关系rn的实体节点类型作用域,Tn=domain(rn-1)函数表示为关系rn-1的实体节点类型值域,此时Tn即为关系rn实体节点类型作用域又为关系rn-1的实体节点类型值域,即:
Tn=range(rn)=domain(rn-1) (2)
定义路径P的特征值Sh,P(t),此特征值表示沿着路径P,从燃气表头实体节点h开始能够到达燃气表尾实体节点t的概率;开始游走前,对该特征值进行初始化:
沿路径P游走过程中,每沿着路径游走到一个节点,特征值Sh,P(t)更新一次,更新公式为:
其中tn表示游走过程中遇到的第n个燃气表尾实体节点,P'表示路径P中已经游走过部分的路径,t'为路径P'中的燃气表尾节点,r'是路径P'中与燃气表尾节点t'相连的关系,此时Sh,P(tn)表示游走过程中到达各尾结点时的特征值与概率卷积的求和;其中P(t|t';r')表示从t'节点出发,沿着关系r'游走一步就可以达到节点t的概率:
其中t'是从燃气表尾实体节点t出发下一步可以达到的尾实体节点,r'(t',t)表示从燃气表节点t'出发,游走一步就可以达到节点t的关系为r';r”(t',t")表示从t'节点出发,游走一步就可以达到其他节点t"的全部关系r”;
随机游走过程中,PRA在特征值得到初始化时以及特征值的更新迭代过程中,引入了对有效路径特征的约束条件,无效路径的计算结果为0;可以有效的减小搜索空间;
3.2)通过随机游走得到一系列燃气表图谱路径特征后,生成路径特征集Fr=(F1,F2,F3,...,Fn),PRA利用这些特征为燃气表图谱中任意关系r训练一个线性预测试的排序模型;
Fr中的每个特征Fn对应一个特征值其中Pn为生成该特征值的路径,h为该路径头结点,t为该路径中的尾结点;因此,特征集Fr对应一个路径集Pr=(P1,P2,P3,...,Pn);Fr中的每个训练样本,即每对燃气表头实体节点h和燃气表尾实体节点t的组合的得分计算如下:
其中Pi中的i表示Pi是路径集Pr的第i个样本路径,Pr是特征集Fr对应的路径集;
根据每个样本路径的得分,可以通过一个逻辑回归函数得到每一个样本路径Pi的概率pi(r=1∣score(hi,ti))为:
其中exp(score(hi,ti))表示以自然常数e为底,score(hi,ti)为指数的指数函数,其中score(hi,ti)表示燃气表头实体结点为hi、燃气表尾实体结点为ti的组合对应样本路径的得分;头节点hi与尾节点ti组合对应的样本路径为Pi,pi中的i表示概率pi对应路径Pi;
将概率pi(r=1∣score(hi,ti))通过线性变换加上最大似然估计,得到损失函数如下:
li=yilnpi+(1-yi)ln(1-pi) (8)
其中pi表示路径Pi对应组合样本的概率,其中yi表示hi,ti是否为关系r的头实体节点与尾实体节点,若存在(hi,r,ti),则yi=1否则yi=0;li中的i表示li对应概率pi;
依据概率pi以及损失函数li对关系r进行线性预测试,在给定燃气表头节点h和关系h时,预测燃气表尾节点t;在给定燃气表尾节点t和关系h时,预测燃气表头节点h;预测时选取对应概率较大的三元组,当概率相近时,则选择损失函数较小的三元组;最终得到补全缺失的节点的燃气表知识图谱;
(4)利用步骤(3)构建的燃气表知识图谱,使用深度游走算法提取燃气表节点特征,进行超声波燃气表节点故障诊断;
4.1)对于已建立的超声波燃气表节点,使用深度游走算法提取燃气表节点特征,快速判断更新后数据是否异常,以此诊断超声波燃气表是否故障;
4.1.1)使用深度游走算法提取燃气表知识图谱中采样幅值标准范围节点的特征值范围,其中A0为节点特征值最小值,B0为节点特征值最大值;使用同样方法提取实时采样幅值节点的特征Cm,max,和标准范围节点值(A0,B0)进行比较,如果后比较结果为:Cm,max<A0,则判断超声波燃气表节点出现故障;
4.1.2)使用深度游走算法提取燃气表知识图谱中实时顺流传播时间节点的特征值tm,down、实时逆流传播时间节点的特征值tm,up、燃气流速节点的特征值vm和时间阈值节点的特征值Δt;当燃气流速特征值vm=0时,当tm,down=tm,up与t0,down=t0,up之间的差值达到Δt时,则判断超声波燃气表节点出现故障;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211106039.2A CN116244443A (zh) | 2022-09-09 | 2022-09-09 | 一种基于知识图谱的超声波燃气表节点故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211106039.2A CN116244443A (zh) | 2022-09-09 | 2022-09-09 | 一种基于知识图谱的超声波燃气表节点故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116244443A true CN116244443A (zh) | 2023-06-09 |
Family
ID=86631892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211106039.2A Pending CN116244443A (zh) | 2022-09-09 | 2022-09-09 | 一种基于知识图谱的超声波燃气表节点故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116244443A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116539128A (zh) * | 2023-06-26 | 2023-08-04 | 成都秦川物联网科技股份有限公司 | 智慧燃气超声波计量仪表准确度诊断方法及物联网系统 |
CN117573668A (zh) * | 2024-01-15 | 2024-02-20 | 上海真兰仪表科技股份有限公司 | 一种基于超声波燃气表计量数据的优化方法 |
-
2022
- 2022-09-09 CN CN202211106039.2A patent/CN116244443A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116539128A (zh) * | 2023-06-26 | 2023-08-04 | 成都秦川物联网科技股份有限公司 | 智慧燃气超声波计量仪表准确度诊断方法及物联网系统 |
US20230366706A1 (en) * | 2023-06-26 | 2023-11-16 | Chengdu Qinchuan Iot Technology Co., Ltd. | Methods and internet of things (iot) systems for diagnosing accuracy of smart gas ultrasonic meters |
CN116539128B (zh) * | 2023-06-26 | 2023-11-17 | 成都秦川物联网科技股份有限公司 | 智慧燃气超声波计量仪表准确度诊断方法及物联网系统 |
US12007251B2 (en) * | 2023-06-26 | 2024-06-11 | Chengdu Qinchuan Iot Technology Co., Ltd. | Methods and internet of things (IoT) systems for diagnosing accuracy of smart gas ultrasonic meters |
CN117573668A (zh) * | 2024-01-15 | 2024-02-20 | 上海真兰仪表科技股份有限公司 | 一种基于超声波燃气表计量数据的优化方法 |
CN117573668B (zh) * | 2024-01-15 | 2024-04-09 | 上海真兰仪表科技股份有限公司 | 一种基于超声波燃气表计量数据的优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368095B (zh) | 基于水利知识-事理耦合网络的决策支持系统架构与方法 | |
JP7392668B2 (ja) | データ処理方法および電子機器 | |
Xue et al. | Knowledge graph quality management: a comprehensive survey | |
CN116244443A (zh) | 一种基于知识图谱的超声波燃气表节点故障诊断方法 | |
CN101093559B (zh) | 一种基于知识发现的专家系统构造方法 | |
US20190107645A1 (en) | Recommendation engine for a cognitive reservoir system | |
Chen et al. | Graph neural network-based fault diagnosis: a review | |
CN109828925B (zh) | 一种基于软件网络结构特征的软件可靠性度量方法 | |
CN113032238B (zh) | 基于应用知识图谱的实时根因分析方法 | |
Duan et al. | Root cause analysis approach based on reverse cascading decomposition in QFD and fuzzy weight ARM for quality accidents | |
CN113779264B (zh) | 基于专利供需知识图谱的交易推荐方法 | |
CN117708746B (zh) | 一种基于多模态数据融合的风险预测方法 | |
CN115511119A (zh) | 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统 | |
CN111931936A (zh) | 一种协同案例推理与语义模型推理的设备故障诊断方法 | |
CN113094863A (zh) | 一种考虑失效传播的民机系统运行可靠性评估方法 | |
Milad et al. | Using an azure machine learning approach for flexible pavement maintenance | |
Ben-Yelun et al. | Self-learning locally-optimal hypertuning using maximum entropy, and comparison of machine learning approaches for estimating fatigue life in composite materials of the aerospace industry | |
CN114116957B (zh) | 一种基于知识图谱的电磁信息泄漏智能分析方法 | |
Yu et al. | On formal feature attribution and its approximation | |
CN117472766A (zh) | 测试用例的生成方法、装置、电子设备和介质 | |
Liu et al. | Towards accurate subgraph similarity computation via neural graph pruning | |
Li et al. | Root cause analysis of anomalies based on graph convolutional neural network | |
Wang et al. | Enhancing event sequence modeling with contrastive relational inference | |
Khan et al. | Software defect prediction via deep learning | |
CN114723323A (zh) | 一种融合物理知识的数据驱动风险分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |