CN115511119A - 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统 - Google Patents
基于知识图谱和贝叶斯的供热系统智能诊断方法及系统 Download PDFInfo
- Publication number
- CN115511119A CN115511119A CN202211138068.7A CN202211138068A CN115511119A CN 115511119 A CN115511119 A CN 115511119A CN 202211138068 A CN202211138068 A CN 202211138068A CN 115511119 A CN115511119 A CN 115511119A
- Authority
- CN
- China
- Prior art keywords
- fault
- data
- heat supply
- knowledge
- heating system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000010438 heat treatment Methods 0.000 claims abstract description 66
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000007499 fusion processing Methods 0.000 claims abstract description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 12
- 238000002372 labelling Methods 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000002485 combustion reaction Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 239000000463 material Substances 0.000 claims description 4
- 230000007797 corrosion Effects 0.000 claims description 3
- 238000005260 corrosion Methods 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 239000000779 smoke Substances 0.000 claims description 3
- 238000007794 visualization technique Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 241000270322 Lepidosauria Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于知识图谱和贝叶斯的供热系统智能诊断方法,包括:获取供热系统的多元数据;基于获取的供热系统多元数据,分别进行实体识别、知识抽取和知识融合处理后建立供热系统故障知识图谱;基于供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络;确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断;能够综合运用知识图谱和贝叶斯网络技术,将零散的人工经验及庞杂的文本知识有效进行关联和故障推理,实现故障根因推理定位,辅助解决供热系统故障诊断问题。
Description
技术领域
本发明属于供热诊断技术领域,具体涉及一种基于知识图谱和贝叶斯的供热系统智能诊断方法及系统。
背景技术
智慧供热系统的自主优化调控是基于各类生产运行数据的实时反馈进行调控,但这些数据中往往掺杂着一些错误、不合理的数据,而且数据来源多种多样,数据关系错综复杂,如果不对这些数据加以诊断、筛选和关系梳理,仍以掺杂的错误数据作为系统自动调控的基础数据,那么整个供热系统的自动调控将会出现异常。另外,在供热系统运行中如何及时发现各类系统故障进行智能诊断,这些问题不仅威胁供热系统安全、稳定运行,而且难以保障管网平衡调节。
然而,由人工发现供热系统中存在的各类系统异常全部依靠运行人员的经验,但随着供热系统规模呈指数上升,系统设备越多,出现故障的概率越大,发现故障的及时率越低,无法及时、准确的发现供热系统存在的各类异常。而且,人工运行诊断过度依赖人员经验,经验层级不同,发现问题的质量和数量也会不同。
知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的技术方法,旨在从数据中识别、发现和推断事物之间的复杂关系,是事物关系的可计算模型。随着5G、物联网、大数据、云计算等技术的飞速发展,在智慧供热智能诊断技术领域需要处理的关联关系数据越来越多,呈指数级的增长,而传统的关系型数据库在处理大规模关联关系的场景中越来越不堪重负,亟需一种支持海量复杂关系查询数据库和分析的产品。为了更加高效地管理供热数据,清洗数据分类结构,满足多专业多用户更高效、更灵活、更精准的信息获取需求,可将知识图谱技术应用于供热诊断中,通过知识图谱技术解决数据的孤立性,提高供热诊断的效率。
基于上述技术问题,需要设计一种新的基于知识图谱和贝叶斯的供热系统智能诊断方法及系统。
发明内容
本发明所要解决的技术问题是,克服现有技术的不足,提供一种基于知识图谱和贝叶斯的供热系统智能诊断方法及系统,一方面综合运用图谱的知识表示、知识推理、知识查询等技术,将零散的人工经验及庞杂的文本知识有效进行关联,实现故障根因推理定位,辅助解决供热系统故障问题;另一方面能够由故障知识图谱查询子图为贝叶斯网络提供网络结构,并由贝叶斯网络推理出故障原因,完成故障诊断,能够区分知识图谱检索结果的重要程度并减少专家的人工参与。
为了解决上述技术问题,本发明的技术方案是:
本发明提供了一种基于知识图谱和贝叶斯的供热系统智能诊断方法,它包括:
步骤S1、获取供热系统的多元数据;
步骤S2、基于获取的供热系统多元数据,分别进行实体识别、知识抽取和知识融合处理后建立供热系统故障知识图谱;
步骤S3、基于供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络;
步骤S4、确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断。
进一步,所述步骤S1中,获取供热系统的多元数据,包括:
获取供热系统热源、热网和热用户的基本数据和故障数据;所述基本数据至少包括热源、网络和热用户的设备型号、管道规格和系统运行中设备的压力、流量、温度数据;所述故障数据至少包括历史故障类型、故障表现、故障成因分析和故障处理。
进一步,所述步骤S2中,基于获取的供热系统多元数据,进行实体识别,包括:
将获取的供热系统多元数据划分为故障结构化数据、故障半结构化数据和故障非结构化数据;
对所述故障结构化数据进行实体识别:通过供热系统热源、热网和热用户各设备间的拓扑属性、连接节点、结合设备名称、设备耦合关系、设备运行状态数据和故障类型,并结合存储的关系型数据库进行数据分析,获得供热系统实体识别信息;
对所述故障半结构化数据进行实体识别:根据供热系统热源、热网和热用户各设备运行数据和故障数据存储的规范化结构,去除无效数据字符,将关键数据进行提取分析,获得供热系统实体识别信息;
对所述故障非结构化数据进行实体识别:将非结构化数据文本转化按照预先定义的实体类型进行语料标注;将语料标注后生成的标注信息转化为BIOES集格式;对语料标注后的数据文本进行数据增强和预处理;将数据增强和预处理后的数据文本通过设置的BERT模型转换为向量形式,表明单个词语在整个语句的关系以及词语和词语之间的相互关系;设置双向神经网络BiLSTM模型以BERT生成的词向量作为输入,通过自动捕获上下文特征,获得深层语义信息;设置条件随机场CRF模型,根据上下文语义信息,在对应输入条件下,获得最大概率输出的标注序列,并根据标注序列提取文本中的供热系统故障实体识别信息。
进一步,所述故障结构化数据至少包括供热系统设备拓扑结构、型号、管道规格确定性数据和各设备运行状态、故障数据,以关系型数据库进行存储;所述故障半结构化数据包括各设备运行数据和故障数据中设备存储信息结构不一致的数据;所述故障非结构化数据包括各设备运行数据和故障数据中没有结构的数据。
进一步,所述热源的实体包括热源概况、燃烧设备、烟风系统、补水系统、水循环系统和热源故障类型;所述热网的实体包括热网节点、管段、阀门、补偿器、检查井和热网故障类型;所述热用户的实体包括换热器、水泵、水箱、过滤器、阀门和热用户故障类型。
进一步,所述基于获取的供热系统多元数据,进行知识抽取,包括:
对实体识别后的供热系统数据进行实体、实体属性,以及实体与实体,实体与属性间的关系抽取;
基于实体、实体属性,以及实体与实体,实体与属性间的关系,形成热源故障子图模型、热网故障子图模型和热用户故障子图模型;所述热源故障子图模型包括承压元件故障、锅炉燃烧异常、辅助设备故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性;所述热网故障子图模型包括管道内外腐蚀、焊缝破裂、管壁撕裂、机械碰撞、阀门故障、补偿器故障和管道阻塞故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性;所述热用户故障子图模型的实体为包括换热器故障、水泵故障、阀门故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性。
进一步,所述基于获取的供热系统多元数据,进行知识融合,包括:对知识抽取的热源故障子图模型、热网故障子图模型和热用户故障子图模型进行包括实体对齐、类型对齐、属性对齐,建立关联关系的故障知识融合,形成供热系统故障知识图谱。
进一步,所述步骤S3中,基于供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络,包括:
将故障信息进行预处理后,通过供热系统故障知识图谱查找搜索具有相同故障现象的故障节点,以及查找搜索出这些故障节点的故障设备定位、故障成因和故障处理方式;
根据故障节点、故障设备定位、故障成因和故障处理方式建立故障知识图谱查询子图;
基于故障知识图谱查询子图,采用贝叶斯网络可视化方法进行贝叶斯网络结构建模。
进一步,所述步骤S4中,确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断,包括:
根据贝叶斯定理计算获得故障原因r引发故障现象p的概率,表示为:
故障原因r发生的先验概率,表示为:
采用noisy-OR方法计算节点之间的关联强度,表示为:
贝叶斯网络中各个节点的条件概率,表示为:
其中,节点b1,b2,…,bn是引发节点a的原因,节点之间相互独立;pa(a)是节点a的父节点集合;pa(a)+是节点a父节点取值为真的集合;是节点a不发生;Pi是节点之间的关联强度,定义为父节点bi为真,其他父节点为假条件下,节点a发生的概率;
将故障原因发生的先验概率、贝叶斯网络中各个节点之间的关联强度和条件概率输入至贝叶斯网络中进行推理分析后,获得引发故障现象的故障原因,实现供热系统智能诊断。
本发明还提供了一种基于知识图谱和贝叶斯的供热系统智能诊断系统,所述供热系统智能诊断系统包括:
数据获取单元,用于获取供热系统的多元数据;
知识图谱构建单元,用于根据获取的供热系统多元数据,分别进行实体识别、知识抽取和知识融合处理后建立供热系统故障知识图谱;
贝叶斯网络构建单元,用于根据供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络;
智能诊断单元,用于确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断。
本发明的有益效果是:
本发明通过获取供热系统的多元数据;基于获取的供热系统多元数据,分别进行实体识别、知识抽取和知识融合处理后建立供热系统故障知识图谱;基于供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络;确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断;一方面综合运用图谱的知识表示、知识推理、知识查询等技术,将零散的人工经验及庞杂的文本知识有效进行关联,实现故障根因推理定位,辅助解决供热系统故障问题;另一方面能够由故障知识图谱查询子图为贝叶斯网络提供网络结构,并由贝叶斯网络推理出故障原因,完成故障诊断,能够区分知识图谱检索结果的重要程度并减少专家的人工参与。
其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于知识图谱和贝叶斯的供热系统智能诊断方法流程图;
图2为本发明水泵故障知识图谱查询子图的示意图;
图3为本发明一种基于知识图谱和贝叶斯的供热系统智能诊断系统结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
图1是本发明所涉及的一种基于知识图谱和贝叶斯的供热系统智能诊断方法流程图。
图2是本发明所涉及的水泵故障知识图谱查询子图的示意图。
如图1-2所示,本实施例1提供了一种基于知识图谱和贝叶斯的供热系统智能诊断方法,它包括:
步骤S1、获取供热系统的多元数据;
步骤S2、基于获取的供热系统多元数据,分别进行实体识别、知识抽取和知识融合处理后建立供热系统故障知识图谱;
步骤S3、基于供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络;
步骤S4、确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断。
在本实施例中,所述步骤S1中,获取供热系统的多元数据,包括:
获取供热系统热源、热网和热用户的基本数据和故障数据;所述基本数据至少包括热源、网络和热用户的设备型号、管道规格和系统运行中设备的压力、流量、温度数据;所述故障数据至少包括历史故障类型、故障表现、故障成因分析和故障处理。
在本实施例中,所述步骤S2中,基于获取的供热系统多元数据,进行实体识别,包括:
将获取的供热系统多元数据划分为故障结构化数据、故障半结构化数据和故障非结构化数据;
对所述故障结构化数据进行实体识别:通过供热系统热源、热网和热用户各设备间的拓扑属性、连接节点、结合设备名称、设备耦合关系、设备运行状态数据和故障类型,并结合存储的关系型数据库进行数据分析,获得供热系统实体识别信息;
对所述故障半结构化数据进行实体识别:根据供热系统热源、热网和热用户各设备运行数据和故障数据存储的规范化结构,去除无效数据字符,将关键数据进行提取分析,获得供热系统实体识别信息;
对所述故障非结构化数据进行实体识别:将非结构化数据文本转化按照预先定义的实体类型进行语料标注;将语料标注后生成的标注信息转化为BIOES集格式;对语料标注后的数据文本进行数据增强和预处理;将数据增强和预处理后的数据文本通过设置的BERT模型转换为向量形式,表明单个词语在整个语句的关系以及词语和词语之间的相互关系;设置双向神经网络BiLSTM模型以BERT生成的词向量作为输入,通过自动捕获上下文特征,获得深层语义信息;设置条件随机场CRF模型,根据上下文语义信息,在对应输入条件下,获得最大概率输出的标注序列,并根据标注序列提取文本中的供热系统故障实体识别信息。
需要说明的是,为了避免复杂的特征工程,减少语言学专家的人工参与,命名实体识别逐渐由传统的统计学习方法转移到深度学习方法。深度学习方法通过深层神经网络结构学习文本中蕴含的相关信息。在有监督下的深度学习任务中,语料标注的一致性和准确性对实体识别模型训练质量有着至关重要的作用,为提高语料标注的效率和准确性,采用BIOES集,B表示实体开始,I表示故障内部,O表示非实体的其他部分,E表示实体结束,S表示实体只有一个字;BERT模型通过向量形式表达的相互关系在一定程度上,可以表现出这句话中不同词语之间的关联度和重要性,通过相互系数来改变每个词的权重,获得的词向量表征能够更好地结合上下文的语境;BiLSTM由一个前向长短期记忆单元与一个后向长短期记忆单元组合,通过把原始有顺序的输入转换成一正一反的2个输入,使得整个模型能同时获得前向和后向的信息,能够更好地获取较长距离的双向语义依赖关系,并解决梯度消失的问题。针对供热系统故障实体识别的序列标注任务,拥有更好的优势;CRF是一种条件概率分布模型,为标注的序列赋予对应概率值,有助于选择出最大似然概率的标注序列。
在本实施例中,所述故障结构化数据至少包括供热系统设备拓扑结构、型号、管道规格确定性数据和各设备运行状态、故障数据,以关系型数据库进行存储;所述故障半结构化数据包括各设备运行数据和故障数据中设备存储信息结构不一致的数据;所述故障非结构化数据包括各设备运行数据和故障数据中没有结构的数据。
在本实施例中,所述热源的实体包括热源概况、燃烧设备、烟风系统、补水系统、水循环系统和热源故障类型;所述热网的实体包括热网节点、管段、阀门、补偿器、检查井和热网故障类型;所述热用户的实体包括换热器、水泵、水箱、过滤器、阀门和热用户故障类型。
在本实施例中,所述基于获取的供热系统多元数据,进行知识抽取,包括:
对实体识别后的供热系统数据进行实体、实体属性,以及实体与实体,实体与属性间的关系抽取;
基于实体、实体属性,以及实体与实体,实体与属性间的关系,形成热源故障子图模型、热网故障子图模型和热用户故障子图模型;所述热源故障子图模型包括承压元件故障、锅炉燃烧异常、辅助设备故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性;所述热网故障子图模型包括管道内外腐蚀、焊缝破裂、管壁撕裂、机械碰撞、阀门故障、补偿器故障和管道阻塞故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性;所述热用户故障子图模型的实体为包括换热器故障、水泵故障、阀门故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性。
在本实施例中,所述基于获取的供热系统多元数据,进行知识融合,包括:对知识抽取的热源故障子图模型、热网故障子图模型和热用户故障子图模型进行包括实体对齐、类型对齐、属性对齐,建立关联关系的故障知识融合,形成供热系统故障知识图谱。
需要说明的是,知识图谱构建的流程主要包括:数据获取、知识抽取、知识融合和质量评估。
(1)数据获取:想要构建一个完整的知识图谱,必须有充足且丰富的数据。构建知识图谱的第一个阶段就是收集大量的数据。我们需要从多个数据源获取数据,比如供热系统诊断技术领域的知识图谱,我们可以从文献库、供热网站、运行过程数据库等来获取数据类型多样的数据。此时的数据获取,若只依靠人工来进行收集,那么不仅消耗人力物力,而且效率极低,因此我们可以借助爬虫自动获取数据。
(2)知识抽取:在数据获取阶段,我们已经获得了我们需要的信息。但这些信息可能是以文本的形式存在,可能是以数据的形式存在,这些信息无法直接用于构建知识图谱,我们需要在这些数据中抽取出可以构建知识图谱的知识,也就是构建知识图谱的最小元素三元组。
(3)知识融合:知识抽取出来之后,实际上都是一些零散的、杂乱的、重复的、不确定的内容。我们需要将抽取的知识进行融合,只有保障知识是正确的、结构化的、无冗余,才能加入到知识图谱中。我们获得的两个三元组,指向的是同一实体但表述不同或者有歧义,那么需要进行实体消歧;如果获得的三元组属性表述不规范,需要进行属性校正;或者抽取的信息因为不确定其准确性,需要利用融合模型判定信息的真实程度。只有将抽取的知识整理成规范的,格式一致的准确信息才能加入到知识图谱中。
(4)质量评估:构建出知识图谱后,其实不能保证它的准确性,需要使用知识推理的方法来对构建的知识图谱进行质量评估。比如使用链接预测的方法验证知识图谱的准确性,去掉已知的正确的知识的关系,如果通过多次的链接预测能够预测出去掉的关系,那么说明构建的知识图谱还是比较可靠的。
在本实施例中,所述步骤S3中,基于供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络,包括:
将故障信息进行预处理后,通过供热系统故障知识图谱查找搜索具有相同故障现象的故障节点,以及查找搜索出这些故障节点的故障设备定位、故障成因和故障处理方式;
根据故障节点、故障设备定位、故障成因和故障处理方式建立故障知识图谱查询子图;
基于故障知识图谱查询子图,采用贝叶斯网络可视化方法进行贝叶斯网络结构建模。
在本实施例中,所述步骤S4,确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断,包括:
根据贝叶斯定理计算获得故障原因r引发故障现象p的概率,表示为:
故障原因r发生的先验概率,表示为:
采用noisy-OR方法计算节点之间的关联强度,表示为:
贝叶斯网络中各个节点的条件概率,表示为:
其中,节点b1,b2,…,bn是引发节点a的原因,节点之间相互独立;pa(a)是节点a的父节点集合;pa(a)+是节点a父节点取值为真的集合;是节点a不发生;Pi是节点之间的关联强度,定义为父节点bi为真,其他父节点为假条件下,节点a发生的概率;
将故障原因发生的先验概率、贝叶斯网络中各个节点之间的关联强度和条件概率输入至贝叶斯网络中进行推理分析后,获得引发故障现象的故障原因,实现供热系统智能诊断。
需要说明的是,贝叶斯网络借助有向无环图来表达图中变量节点之间的关联关系,使用条件概率表来描述有向无环图中各个相邻变量节点之间的关联强度。贝叶斯网络构建完成后就能通过分析变量节点的联合概率分布、变量节点间的关联关系,以及关联强度进行推理,即通过一些变量的观测值来推测其它变量的取值概率。但是,使用贝叶斯网络进行推理首先要确定贝叶斯网络的网络结构,采用知识图谱为贝叶斯网络提供所需的网络结构,然后由贝叶斯网络进行推理从而完成故障诊断,可以解决需要领域专家通过查找大量资料并根据经验进行贝叶斯网络的构建问题。
实施例2
图3是本发明所涉及的一种基于知识图谱和贝叶斯的供热系统智能诊断系统结构图。
如图3所示,本实施例2还提供了一种基于知识图谱和贝叶斯的供热系统智能诊断系统,所述供热系统智能诊断系统包括:
数据获取单元,用于获取供热系统的多元数据;
知识图谱构建单元,用于根据获取的供热系统多元数据,分别进行实体识别、知识抽取和知识融合处理后建立供热系统故障知识图谱;
贝叶斯网络构建单元,用于根据供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络;
智能诊断单元,用于确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (10)
1.一种基于知识图谱和贝叶斯的供热系统智能诊断方法,其特征在于,它包括:
步骤S1、获取供热系统的多元数据;
步骤S2、基于获取的供热系统多元数据,分别进行实体识别、知识抽取和知识融合处理后建立供热系统故障知识图谱;
步骤S3、基于供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络;
步骤S4、确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断。
2.根据权利要求1所述的供热系统智能诊断方法,其特征在于,所述步骤S1中,获取供热系统的多元数据,包括:
获取供热系统热源、热网和热用户的基本数据和故障数据;所述基本数据至少包括热源、网络和热用户的设备型号、管道规格和系统运行中设备的压力、流量、温度数据;所述故障数据至少包括历史故障类型、故障表现、故障成因分析和故障处理。
3.根据权利要求1所述的供热系统智能诊断方法,其特征在于,所述步骤S2中,基于获取的供热系统多元数据,进行实体识别,包括:
将获取的供热系统多元数据划分为故障结构化数据、故障半结构化数据和故障非结构化数据;
对所述故障结构化数据进行实体识别:通过供热系统热源、热网和热用户各设备间的拓扑属性、连接节点、结合设备名称、设备耦合关系、设备运行状态数据和故障类型,并结合存储的关系型数据库进行数据分析,获得供热系统实体识别信息;
对所述故障半结构化数据进行实体识别:根据供热系统热源、热网和热用户各设备运行数据和故障数据存储的规范化结构,去除无效数据字符,将关键数据进行提取分析,获得供热系统实体识别信息;
对所述故障非结构化数据进行实体识别:将非结构化数据文本转化按照预先定义的实体类型进行语料标注;将语料标注后生成的标注信息转化为BIOES集格式;对语料标注后的数据文本进行数据增强和预处理;将数据增强和预处理后的数据文本通过设置的BERT模型转换为向量形式,表明单个词语在整个语句的关系以及词语和词语之间的相互关系;设置双向神经网络BiLSTM模型以BERT生成的词向量作为输入,通过自动捕获上下文特征,获得深层语义信息;设置条件随机场CRF模型,根据上下文语义信息,在对应输入条件下,获得最大概率输出的标注序列,并根据标注序列提取文本中的供热系统故障实体识别信息。
4.根据权利要求3所述的供热系统智能诊断方法,其特征在于,所述故障结构化数据至少包括供热系统设备拓扑结构、型号、管道规格确定性数据和各设备运行状态、故障数据,以关系型数据库进行存储;所述故障半结构化数据包括各设备运行数据和故障数据中设备存储信息结构不一致的数据;所述故障非结构化数据包括各设备运行数据和故障数据中没有结构的数据。
5.根据权利要求3所述的供热系统智能诊断方法,其特征在于,所述热源的实体包括热源概况、燃烧设备、烟风系统、补水系统、水循环系统和热源故障类型;所述热网的实体包括热网节点、管段、阀门、补偿器、检查井和热网故障类型;所述热用户的实体包括换热器、水泵、水箱、过滤器、阀门和热用户故障类型。
6.根据权利要求1所述的供热系统智能诊断方法,其特征在于,所述基于获取的供热系统多元数据,进行知识抽取,包括:
对实体识别后的供热系统数据进行实体、实体属性,以及实体与实体,实体与属性间的关系抽取;
基于实体、实体属性,以及实体与实体,实体与属性间的关系,形成热源故障子图模型、热网故障子图模型和热用户故障子图模型;所述热源故障子图模型包括承压元件故障、锅炉燃烧异常、辅助设备故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性;所述热网故障子图模型包括管道内外腐蚀、焊缝破裂、管壁撕裂、机械碰撞、阀门故障、补偿器故障和管道阻塞故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性;所述热用户故障子图模型的实体为包括换热器故障、水泵故障、阀门故障实体,以及描述实体的故障表现形式、故障成因和故障处理属性。
7.根据权利要求1所述的供热系统智能诊断方法,其特征在于,所述基于获取的供热系统多元数据,进行知识融合,包括:对知识抽取的热源故障子图模型、热网故障子图模型和热用户故障子图模型进行包括实体对齐、类型对齐、属性对齐,建立关联关系的故障知识融合,形成供热系统故障知识图谱。
8.根据权利要求1所述的供热系统智能诊断方法,其特征在于,所述步骤S3中,基于供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络,包括:
将故障信息进行预处理后,通过供热系统故障知识图谱查找搜索具有相同故障现象的故障节点,以及查找搜索出这些故障节点的故障设备定位、故障成因和故障处理方式;
根据故障节点、故障设备定位、故障成因和故障处理方式建立故障知识图谱查询子图;
基于故障知识图谱查询子图,采用贝叶斯网络可视化方法进行贝叶斯网络结构建模。
9.根据权利要求1所述的供热系统智能诊断方法,其特征在于,所述步骤S4中,确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断,包括:
根据贝叶斯定理计算获得故障原因r引发故障现象p的概率,表示为:
故障原因r发生的先验概率,表示为:
采用noisy-OR方法计算节点之间的关联强度,表示为:
贝叶斯网络中各个节点的条件概率,表示为:
其中,节点b1,b2,…,bn是引发节点a的原因,节点之间相互独立;pa(a)是节点a的父节点集合;pa(a)+是节点a父节点取值为真的集合;是节点a不发生;Pi是节点之间的关联强度,定义为父节点bi为真,其他父节点为假条件下,节点a发生的概率;
将故障原因发生的先验概率、贝叶斯网络中各个节点之间的关联强度和条件概率输入至贝叶斯网络中进行推理分析后,获得引发故障现象的故障原因,实现供热系统智能诊断。
10.一种基于知识图谱和贝叶斯的供热系统智能诊断系统,其特征在于,所述供热系统智能诊断系统包括:
数据获取单元,用于获取供热系统的多元数据;
知识图谱构建单元,用于根据获取的供热系统多元数据,分别进行实体识别、知识抽取和知识融合处理后建立供热系统故障知识图谱;
贝叶斯网络构建单元,用于根据供热系统故障知识图谱进行系统故障检索,并根据检索获得的故障知识图谱查询子图构建贝叶斯网络;
智能诊断单元,用于确定故障原因发生的先验概率以及贝叶斯网络中各个节点的条件概率,利用贝叶斯网络进行推理获得引发故障现象的故障原因,实现供热系统智能诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211138068.7A CN115511119A (zh) | 2022-09-19 | 2022-09-19 | 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211138068.7A CN115511119A (zh) | 2022-09-19 | 2022-09-19 | 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115511119A true CN115511119A (zh) | 2022-12-23 |
Family
ID=84503915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211138068.7A Pending CN115511119A (zh) | 2022-09-19 | 2022-09-19 | 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115511119A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116360387A (zh) * | 2023-01-18 | 2023-06-30 | 北京控制工程研究所 | 融合贝叶斯网络和性能-故障关系图谱的故障定位方法 |
CN117093722A (zh) * | 2023-07-25 | 2023-11-21 | 中国石油大学(北京) | 用于诊断输气管道站场内设备故障的方法及处理器 |
CN117114102A (zh) * | 2023-10-13 | 2023-11-24 | 江苏前景瑞信科技发展有限公司 | 一种基于贝叶斯网络和故障树的变压器故障诊断方法 |
CN117272170A (zh) * | 2023-09-20 | 2023-12-22 | 东旺智能科技(上海)有限公司 | 一种基于知识图谱的it运维故障根因分析方法 |
CN117763449A (zh) * | 2023-12-28 | 2024-03-26 | 易站智联科技(广州)有限公司 | 一种多源故障自主定位与分类方法 |
-
2022
- 2022-09-19 CN CN202211138068.7A patent/CN115511119A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116360387A (zh) * | 2023-01-18 | 2023-06-30 | 北京控制工程研究所 | 融合贝叶斯网络和性能-故障关系图谱的故障定位方法 |
CN116360387B (zh) * | 2023-01-18 | 2023-09-15 | 北京控制工程研究所 | 融合贝叶斯网络和性能-故障关系图谱的故障定位方法 |
CN117093722A (zh) * | 2023-07-25 | 2023-11-21 | 中国石油大学(北京) | 用于诊断输气管道站场内设备故障的方法及处理器 |
CN117272170A (zh) * | 2023-09-20 | 2023-12-22 | 东旺智能科技(上海)有限公司 | 一种基于知识图谱的it运维故障根因分析方法 |
CN117272170B (zh) * | 2023-09-20 | 2024-03-08 | 东旺智能科技(上海)有限公司 | 一种基于知识图谱的it运维故障根因分析方法 |
CN117114102A (zh) * | 2023-10-13 | 2023-11-24 | 江苏前景瑞信科技发展有限公司 | 一种基于贝叶斯网络和故障树的变压器故障诊断方法 |
CN117763449A (zh) * | 2023-12-28 | 2024-03-26 | 易站智联科技(广州)有限公司 | 一种多源故障自主定位与分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114579875B (zh) | 基于知识图谱的设备故障诊断与维修知识推荐系统 | |
CN113723632B (zh) | 一种基于知识图谱的工业设备故障诊断方法 | |
CN115511119A (zh) | 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统 | |
CN110889556B (zh) | 一种企业经营风险特征数据信息提取方法和提取系统 | |
CN115511118A (zh) | 一种基于人工智能的供热系统故障辅助决策方法及系统 | |
CN112612902A (zh) | 一种电网主设备的知识图谱构建方法及设备 | |
Hao et al. | Integrating and navigating engineering design decision-related knowledge using decision knowledge graph | |
CN113779272B (zh) | 基于知识图谱的数据处理方法、装置、设备及存储介质 | |
Li et al. | Fault diagnosis expert system of semiconductor manufacturing equipment using a Bayesian network | |
CN112100403A (zh) | 一种基于神经网络的知识图谱不一致性推理方法 | |
CN114138759B (zh) | 基于知识图谱推理的二次设备故障处理推送方法及系统 | |
CN117271767A (zh) | 基于多智能体的运维知识库的建立方法 | |
CN116245107B (zh) | 电力审计文本实体识别方法、装置、设备及存储介质 | |
US20210019456A1 (en) | Accelerated simulation setup process using prior knowledge extraction for problem matching | |
CN113487211A (zh) | 核电装备质量追溯方法、系统、计算机设备及介质 | |
Yu et al. | An automated metadata generation method for data lake of industrial WoT applications | |
CN117687824A (zh) | 基于质量问题知识图谱的卫星故障诊断系统 | |
Mao et al. | Semantic and Qualitative Physics-Based Reasoning on Plain-English Flow Terms for Generating Function Model Alternatives | |
CN117235280A (zh) | 一种操作票生成方法、装置、设备及介质 | |
CN111694966A (zh) | 面向化工领域的多层次知识图谱构建方法及系统 | |
CN116701590A (zh) | 基于知识图谱构建答案语义空间的视觉问答方法 | |
Wei et al. | A Data-Driven Human–Machine Collaborative Product Design System Toward Intelligent Manufacturing | |
CN109408527B (zh) | 一种基于向量空间的rdf结构化查询自动构建方法 | |
Yang et al. | An Intelligent Risk Assessment Model Based on NLP | |
Lei et al. | Application of distributed machine learning model in fault diagnosis of air preheater |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |