CN114358507A - 基于知识图谱的输水建筑物风险评估与防范方法 - Google Patents
基于知识图谱的输水建筑物风险评估与防范方法 Download PDFInfo
- Publication number
- CN114358507A CN114358507A CN202111504430.3A CN202111504430A CN114358507A CN 114358507 A CN114358507 A CN 114358507A CN 202111504430 A CN202111504430 A CN 202111504430A CN 114358507 A CN114358507 A CN 114358507A
- Authority
- CN
- China
- Prior art keywords
- risk
- type
- water delivery
- knowledge
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000002265 prevention Effects 0.000 title claims abstract description 50
- 238000012502 risk assessment Methods 0.000 title claims abstract description 45
- 230000003449 preventive effect Effects 0.000 claims abstract description 31
- 230000004927 fusion Effects 0.000 claims abstract description 19
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 238000012163 sequencing technique Methods 0.000 claims description 19
- 230000006378 damage Effects 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims 1
- 238000011156 evaluation Methods 0.000 abstract description 9
- 238000007726 management method Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 20
- 238000012549 training Methods 0.000 description 6
- 238000007500 overflow downdraw method Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 229910000831 Steel Inorganic materials 0.000 description 3
- 230000007797 corrosion Effects 0.000 description 3
- 238000005260 corrosion Methods 0.000 description 3
- 230000001066 destructive effect Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000010959 steel Substances 0.000 description 3
- 239000004575 stone Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003673 groundwater Substances 0.000 description 1
- 239000000383 hazardous chemical Substances 0.000 description 1
- 239000013056 hazardous product Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于知识图谱应用技术领域,特别涉及一种基于知识图谱的输水建筑物风险评估与防范方法,包含:构建由实体、属性及关系组成的输水建筑物知识图谱并利用数据库进行数据存储,抽取知识图谱中实体关系三元组并进行数据融合获取规范统一的实体关系描述;基于知识图谱,结合建筑物运行环境和状况,对第一类风险因子和第二类风险因子进行风险识别分析,根据风险识别分析结果并利用路径搜索方法来评估未知风险因子的发生风险值,进而得到已知风险因子的处置决策和未知风险因子的预防措施。本发明可帮助工程运行管理人员直观了解各类输水建筑物运行风险与风险的预防处置措施,并提供风险评估和风险决策结果,具有较好应用前景。
Description
技术领域
本发明属于知识图谱应用技术领域,特别涉及一种基于知识图谱的输水建筑物风险评估与防范方法。
背景技术
2012年5月17日,Google正式提出了知识图谱(Knowledge Graph)的概念,其初衷是为了优化搜索引擎返回的结果,改善用户搜索质量及体验。实际上,知识图谱并不是一个全新的概念,而是在以前的技术或者理论基础上进行的一个重新定义,知识图谱的概念演化经过了本体论,语义网络,web链接数据等阶段。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。在金融、农业、电商、医疗健康、环境保护等大量的垂直领域,知识图谱都得到广泛的应用。
输水工程是调配水资源时空分布不均,改善生态环境的重要设施。我国兴建了世界上很多大型输水工程,这些工程具有沿线距离长,运行环境复杂的特点。工程运行过程中,每个输水建筑物的损坏都可能导致不可想象的后果,因此为保障输水建筑物的正常运行,充分识别和评估工程运行中各种不确定性因素引起的风险显得至关重要。尽管已有很多工程运行标准和专家学者的研究成果,但回答工程运行过程中有哪些风险,这些风险该如何防范和处置,需要考虑大量关系复杂的因素。知识图谱可以将大量知识或事实以网络化的形式进行表示,并结合一些数学方法,完成一些复杂的推理任务。通过知识图谱对输水建筑物进行风险评估业界几乎还是空白,因此通过构建输水建筑物知识图谱对输水建筑物的风险评估及防范决策有着重要意义。
发明内容
为此,本发明提供一种基于知识图谱的输水建筑物风险评估与防范方法,能够对输水建筑物运行过程中的不确定性因素及其风险有针对性地进行评估和防范,能够保证输水建筑物运行过程风险评估的效率和准确性。
按照本发明所提供的设计方案,一种基于知识图谱的输水建筑物风险评估与防范方法,包含如下内容:
构建由实体、属性及关系组成的输水建筑物知识图谱并利用数据库进行数据存储,其中,实体至少包含:建筑物、第一类风险因子(物质或能量)、风险预防/处置措施。关系至少包含:基于事故致因理论,由实体中第一类风险因子导致或后继引起另一种第一类风险因子的第二类风险因子(破坏形式),及对第一类风险因子的控制方式(预防或处置)。属性包含两类风险因子的发生概率;
抽取输水建筑物知识图谱中实体关系三元组并进行数据融合获取规范统一的实体关系描述;
结合工程运行状况,对构建的知识图谱中的两类风险因子实体进行识别,结果包括第一类风险因子是否出现,第二类风险因子发生的概率。利用路径搜索和概率融合方法,对未出现的第一类风险因子进行评估;
结合风险识别和风险评估结果,利用出入度排序方法对已出现的第一类风险因子进行处置决策。根据风险评估结果,对未出现的第一类风险因子进行预防决策。
作为本发明基于知识图谱的输水建筑物风险评估与防范方法,进一步地,采用开源数据库对输水建筑物知识图谱及原始数据进行数据存储。
作为本发明基于知识图谱的输水建筑物风险评估与防范方法,进一步地,采用人工标注和机器学习相结合的方式抽取输水建筑物知识图谱中所需的实体关系三元组。
作为本发明基于知识图谱的输水建筑物风险评估与防范方法,进一步地,利用聚类算法和/或链接方式进行实体消岐的数据融合。
作为本发明基于知识图谱的输水建筑物风险评估与防范方法,进一步地,利用聚类算法进行实体消岐的数据融合时,通过获取目标实体向量语义特征及其上下文信息,基于语义相似度对关联实体进行聚类来进行数据融合。
作为本发明基于知识图谱的输水建筑物风险评估与防范方法,进一步地,利用链接方式进行实体消岐的数据融合时,针对目标实体利用知识和/或人工规则及上下文信息从数据库中获取候选实体;并根据目标实体与候选实体之间的相似度特征来选取相似度最大的候选实体进行链接。
作为本发明基于知识图谱的输水建筑物风险评估与防范方法,进一步地,根据所构建的知识图谱进行建筑物风险分析,首先依据建筑物运行状况识别第一类风险因子节点是否出现,以及第二类风险因子发生的可能性,然后通过路径搜索方法评估未出现第一类风险因子或事故的发生概率;根据第一类风险因子的识别和分析结果,依据节点出入度或出现概率,对相关的风险源实体及事故进行排序来获取第一类风险因子对应的预防控制措施,其中,第一类风险因子为生产过程中存在因意外释放的能量或危险物质,第二类风险因子为导致能量或危险物质约束/限制措施破坏/失效的因素。
作为本发明基于知识图谱的输水建筑物风险评估与防范方法,进一步地,获取处置决策和预防措施中,利用网络节点出入度排序方法对已知风险因子的处置措施进行排序来获取已知风险因子的处置决策结果;根据未知风险因子的发生概率对未知风险因子的预防措施进行排序来获取未知风险因子的的预防措施。
作为本发明基于知识图谱的输水建筑物风险评估与防范方法,进一步地,风险评估模型采用基于图的路径搜索方法和概率融合方法,具体实现过程可设计如下:
1、依据工程运行管理人员风险识别结果,将知识图谱中已发现的第一类风险因子(实体)的出现概率属性设置为1,结合专家经验或历史统计资料,给出第二类风险因子(关系)的发生概率。
2、针对每个未出现的第一类风险因子实体r,通过基于图的路径搜索方法,得到所有已出现第一类风险因子到r的风险路径ti,i=1,2,..n。组成路径ti的连接包括lij,j=1,2,…m。
3、首先根据下式,得到每条风险路径的发生概率:
然后根据下式,得到未出现第一类风险因子实体r的出现概率:
进一步地,可依据对知识图谱中风险因子识别与评估结果,结合知识图谱中的预防措施与处置措施节点,给出风险决策方法,具体实现过程可设计如下:
1、按照知识图谱中每个节点出入度,由大到小,对所有已发现第一类风险因子节点进行排序,查询前K个节点所关联的处置措施节点内容,作为风险处置措施决策结果。
2、按照知识图谱中每个节点出现概率大小,由大到小,对所有未发现第一类风险因子进行排序,查询前K个节点所关联的预防措施节点内容,作为风险预防措施决策结果。
本发明的有益效果:
本发明通过利用输水建筑物知识图谱对南水北调输水建筑物运行过程中的风险进行评估和防范,当遇到某一风险源时,可以通过知识图谱推理出第一类风险源以及对应的风险事故,准备采取对应的防控措施,减少缺水或洪涝等事故发生的可能性,从而达到保护输水建筑物的效果,能够有效解决突发的事故和及时防范隐藏的风险,具有较好的应用前景。
附图说明:
图1为实施例中基于知识图谱的输水建筑物风险评估与防范方法原理示意;
图2为实施例中知识图谱构建流程示意;
图3为实施例中知识图谱节点类型和关系图示意。
图4为实施例中渡槽失效风险因子和预防/处置措施关系图示意;
图5为实施例中风险评估与风险决策流程示意;
具体实施方式:
为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。
本发明实施例,提供一种基于知识图谱的输水建筑物风险评估与防范方法,参见图1所示,包含如下内容:
S101基于实体、属性及关系组成的输水建筑物知识图谱并利用数据库进行数据存储,其中,实体至少包含:建筑物、第一类风险因子(物质或能量)、风险预防/处置措施。关系至少包含:基于事故致因理论,由实体中第一类风险因子导致或后继引起另一种第一类风险因子的第二类风险因子(破坏形式),及对第一类风险因子的控制方式(预防或处置)。属性包含两类风险因子的发生概率;
S102、抽取输水建筑物知识图谱中实体关系三元组并进行数据融合获取规范统一的实体关系描述;
S103基于所构建知识图谱中的风险因子网络,结合建筑物运行环境和状况,进行两类风险因子的识别和风险评估。风险识别包括第一类风险因子(物质或能量)是否存在,第二类风险因子(破坏形式)的发生概率。根据风险识别结果,利用路径搜索方法,评估未知风险因子的发生风险值。
S104基于所构建知识图谱中的风险因子网络,结合风险识别结果和风险评估结果,进行已知风险因子的处置决策和未知风险因子的预防。利用网络节点出入度排序方法,对已知风险因子的处置措施进行排序,得到处置决策结果。根据未知风险因子的发生概率,对未知风险因子的预防措施进行排序,得到预防决策结果。
基于事故致因理论构建输水建筑物知识图谱本体模型,其中,第一类风险因子为生产过程中存在因意外释放的能量或危险物质,第二类风险因子为导致能量或危险物质约束/限制措施破坏/失效的因素。运用人工和机器学习相结合的方法,对大量半结构化和非结构化文本进行分析与识别,构建知识图谱。根据所构建知识图谱,结合当前建筑物的运行状况,对各类风险因子进行识别,包括已经出现的第一类风险因子,以及第二类风险因子的发生概率。然后可以通过路径搜索与概率融合方法,推理出未出现的第一类风险因子或事故的发生概率。通过出入度排序和风险概率排序方法,得到各风险因子的防控措施,能够有效解决突发的事故和及时防范隐藏的风险,减少事故发生的可能性,从而达到保护输水建筑物的效果。
作为本发明实施例中基于知识图谱的输水建筑物风险评估与防范方法,在构建知识图谱过程中,进一步地,采用开源数据库对输水建筑物知识图谱及原始数据进行数据存储。进一步地,采用人工标注和机器学习相结合的方式抽取输水建筑物知识图谱中所需的实体关系三元组。进一步地,利用聚类算法和/或链接方式进行实体消岐的数据融合。进一步地,利用聚类算法进行实体消岐的数据融合时,通过获取目标实体向量语义特征及其上下文信息,基于语义相似度对关联实体进行聚类来进行数据融合。进一步地,利用链接方式进行实体消岐的数据融合时,针对目标实体利用知识和/或人工规则及上下文信息从数据库中获取候选实体;并根据目标实体与候选实体之间的相似度特征来选取相似度最大的候选实体进行链接。
参见图2和3所示,对收集到南水北调运行过程中的结构化、半结构化和/或非结构化的原始运行数据进行数据整合和知识抽取进行初步知识表示,通过数据融合完成实体消岐和共指消解,并利用已有知识通过构建及修订数据模型进行数据规范化,以获取原始数据的标准知识表示,通过知识推理、知识发现进行标准知识表示的质量评估,完成输水建筑物知识图谱构建。基于事故致因理论,可自上而下创建南水北调领域独有的知识图谱模式,实体类型可主要是建筑物、第一类风险因子、风险预防/处置措施等。关系一般是指某第二类风险因子会导致某种破坏形式,或者某一破坏形式发生后继而引起另一种第一类风险因子出现和某第一类风险因子对应的预防或处置措施等。属性则记录某一破坏形式或风险因子发生的概率。如图4所示,可利用输水建筑物知识图谱来评估从目标实体地质灾害到目标实体渡槽槽身倾覆可能发生概率以获取相应预防措施,可帮助工程运行管理人员直观了解各类输水建筑物运行风险与风险的预防处置措施,并提供风险评估和风险决策结果。
作为本发明实施例中基于知识图谱的输水建筑物风险评估与防范方法,进一步地,结合所构建的知识图谱进行风险识别分析,首先依据建筑物运行状况识别第一类风险因子是否出现,以及第二类风险因子的发生概率,通过采用路径搜索与概率融合的方法评估事故发生可能性;根据识别出的第一类风险因子,依据其出入度对相关的风险源实体及事故进行排序来获取第一类风险因子对应的预防控制措施,其中,第一类风险因子为生产过程中存在因意外释放的能量或危险物质,第二类风险因子为导致能量或危险物质约束/限制措施破坏/失效的因素。根据风险评估结果,依据还未出现第二类风险因子实体的发生概率进行排序,来获取第一类风险因子实体相关联的风险预防措施。
进一步地,本案实施例中,采用基于图的路径搜索方法和概率融合方法,具体实现过程可设计如下:
1、依据工程运行管理人员风险识别结果,将知识图谱中已发现的第一类风险因子(实体)的出现概率属性设置为1,结合专家经验或历史统计资料,给出第二类风险因子(关系)的发生概率。
2、针对每个未出现的第一类风险因子实体r,通过基于图的路径搜索方法,得到所有已出现第一类风险因子到r的风险路径ti,i=1,2,..n。组成路径ti的连接包括lij,j=1,2,…m。
3、首先根据下式,得到每条风险路径的发生概率:
然后根据下式,得到未出现第一类风险因子实体r的出现概率:
进一步地,依据对知识图谱中风险因子识别与评估结果,结合知识图谱中的预防措施与处置措施节点,给出风险决策方法,具体实现过程可设计如下:
1、按照知识图谱中每个节点出入度,由大到小,对所有已发现第一类风险因子节点进行排序,查询前K个节点所关联的处置措施节点内容,作为风险处置措施决策结果。
2、按照知识图谱中每个节点出现概率大小,由大到小,对所有未发现第一类风险因子进行排序,查询前K个节点所关联的预防措施节点内容,作为风险预防措施决策结果。
基于事故致因理论,自上而下创建南水北调领域知识图谱模式;基于原生知识图谱的存储方式,选用Neo4j开源数据库进行存储数据;可采用人工和BiLSTM+CRF机器学习相结合的方法抽取图谱中所需要的实体关系三元组,例如(裂缝,导致,槽墩失稳);对存储的数据进行知识的融合,来得到规范统一的描述;通过风险评估,先基于知识图谱建立输水建筑物风险网络的结构,通过识别第一类风险因子状态,以及第二类风险因子发生概率,计算评估事故发生的可能性;并支持风险决策,通过对已经出现的第一类风险因子的出入度,和还未出现的第一类风险因子的发生概率,推荐相对应的风险预防或处置措施。利用图谱的形式能够更好展示南水北调输水建筑物整个知识框架,提供给用户各类风险源风险评估的分析依据,可以给非专业人员相应的防范决策方法来应对遇到的风险因子和事故,从而有效解决突发的事故和及时防范隐藏的风险。
人工和机器学习向结合来提取图谱中所需要的的实体关系三元组中,通过“人工数据标注,训练模型→模型自动识别→人工校验”的步骤,构建BiLSTM+CRF神经网络模型,实现对自然语言文本的实体抽取。其中,BiLSTM+CRF模型工作原理:首先将句子中的字和词映射为向量,即句子的每个组成元素都是一条包含词嵌入和字嵌入的词向量,词嵌入通常是预先训练好的,字嵌入则是预先初始化的。在模型训练过程中,所有的嵌入都会随着训练的迭代过程被调整到最优。BiLSTM将这些嵌入向量作为输入进行运算后,输出结果是每个标签(即实体和关系类别)的预测分值,这些再作为CRF层的输入后,将拥有最高预测得分的序列作为模型的输出。本案方案中,首先通过人工数据标注,构建模型训练集。训练数据源可来自《输水工程应急预案》、《输水工程风险防控手册》等文本,其中,标注示例可举例如下:{"text":"洪水会导致渡槽基础沉陷","spo_list":[{"predicate":"可能导致","object_type":"破坏形式","subject_type":"风险事件","object":"渡槽基础沉陷","subject":"洪水"}]},即需要标注出句子中的实体又要标注出实体所属类别和对应关系。
通过一定量数据集的训练,BiLSTM+CRF模型能够实现对其他文本的自动实体抽取。例如:防洪提外坡脚受洪水淘刷,可能引起坡脚失稳,采用抛投块石或土工膜袋压脚。识别结果:{洪水,可能导致,坡脚失稳},{坡脚失稳,处置措施,抛投石块或土石膜袋压脚}。模型将大量知识抽取结果输出,经人工审核后,决定是否写入知识图谱数据库中。
由于不同数据源可能存在对同一实体表述不一致的情况,例如地基沉陷和地基不均匀沉陷,这将导致知识图谱中的信息冗余,引起等表述不同但表意相同的情况,这时需要将多个重复的实体或关系融合成为一个。本案方案中,可通过人工修改的方式进行知识融合,实现一致性描述,可以将使用频率较低的表述替换为使用频率较高的表述,然后将这些使用频率较低的表述,作为被保留实体关系的“别名”属性。
使用知识图谱进行风险评估过程中,首先根据构筑好的输水建筑物风险因子网络,以及现场识别情况,查询出已发现的第一类风险因子到未发现的第一类风险因子之间的多条演化路径,多条路径组成一个灾害网络。第一类风险因子为结构运行状态(蕴含着事故发生的能量或物质),第二类风险因子为防止事故发生的一系列措施(阻止事故放生的屏障)存在安全的隐患。结构暴露在不同的安全隐患下,通过不同的路径,最终导致事故的发生。如图4所示,即为渡槽在不同破坏形式下的风险演化路径组成的灾害网络,网络中的边描述第二类风险因子(破坏形式)的发生概率。使用知识图谱进行风险评估的过程,即通过识别两类风险源之后,计算网络中各个未发现的第一类风险因子的发生概率。
如图3所示的风险图谱,风险评估过程包括:识别第一类风险因子(安全性态)是否存在;识别第二类风险因子(破坏形式)发生概率;计算未出现的第一类风险因子或事故的概率。
识别第一类风险因子,即识别各个节点的状态,分为出现和未出现。可以通过调查现场情况的方式来识别。例如目前渡槽运行状况良好,则除了附图3中根节点和槽身裂缝状态为出现(概率为1)外,其余节点状态均为未出现(概率待计算)。
识别第二类风险因子,即识别各个边发生的条件概率,可以通过统计历史资料或专家经验评估等方式来确定,以统计历史资料为例:假定经过查阅相关资料,该地区地质灾害发生的次数为a,发生地质灾害后结构出现裂缝的次数为b,则地质灾害引起渡槽裂缝的条件概率为b/a。
计算各个未出现节点的概率,即从图中已出现节点出发,利用各条边的条件概率,计算未出现节点的概率。以图4为例,渡槽建筑物状态条件概率表如下:
通过现场检查等风险识别手段,已知渡槽运行概率为1,槽身裂缝的概率为1。
经计算“钢筋锈蚀”的概率=P(槽身渗漏)=23%;
“边坡失稳”的概率=P(基础渗漏)=16%;
“槽身倾覆”的概率=1-(1-P(地质灾害)*P(渗漏)*P(不安全调度))*(1-P(洪水冲击))
=0.9577%
风险决策包括风险预防措施决策和风险处置措施决策。
风险处置决策过程包括:检索已经存在的第一类风险因子(安全性态)节点,及其控制措施;根据上述节点出入度,对控制措施排序。
例如:工作人员巡检过程中识别出图三中的第一类风险因子(安全性态)节点为“渡槽”“槽身裂缝”。由于渡槽的出入度为2,槽身裂缝的出入度为3,依照出入度大小排序,利用图谱返回“槽身裂缝”的控制措施为控制决策支持,排序输出其余第一类风险因子的控制措施作为控制辅助支持。
风险预防决策过程包括:检索目前尚未存在的第一类风险因子(安全性态)节点,及其预防措施;根据上述节点的概率值,对预防措施进行排序。
例如:通过风险评估,得到各个尚未存在的第一类风险因子节点概率,包括钢筋锈蚀(23%)、边坡失稳(16%)、槽身倾覆(0.9577%),排序输出节点以及预防措施,以最高概率的第一类风险因子节点“钢筋锈蚀”的预防措施作为风险预防决策结果,其余尚未存在的第一类风险因子节点及其预防措施作为参考。
事故致因理论中的两类风险因子实体可分别为:第一类风险因子——生产过程中存在的,可能发生意外释放的能量(能源或能源载体)或危险物质;第二类风险因子——可能导致能量或危险物质约束或限制措施破坏或失效的各种因素。
发生事故往往是两类风险因子共同作用的结果,第一类风险因子是伤亡事故发生的能量主体,决定事故后果的严重程度。第二类风险因子是第一类风险因子造成事故的必要条件,决定事故发生的可能性。例如,在输水工程中会出现的一起安全事故为渠陂失稳,渠水外泄。它的第一类风险因子就是渠陂中的水,也就是能量的载体,水如果越多,事故的后果也就越大,如果没有水,也不会发生渠水外泄。其次,它的第二类风险因子可以是暴雨洪水、地下水位变幅、排水失效等,这些决定了事故发生的可能性。因此,是两类风险因子的共同作用才促成了事故的发生。因此,利用事故致因理论能够合理为风险评估铺垫出一个基础。由于第一类风险因子的存在是第二类风险因子出现的前提,第二类风险因子的出现是第一类风险因子导致事故的必要条件。因此风险识别的首要任务是辨识第一类风险因子(节点),在此基础上再辨识第二类风险因子(边)。参见图5所示,基于事故致因理论和知识图谱,在进行风险评估的时候,首先识别出第一类风险因子是否存在,以及第二类风险因子发生概率,然后通过独立路径搜索和计算,最终评估事故发生的概率。通过在检索系统中检索每一个已发现的第一类风险因子,利用其出入度对其进行排序,根据排序结果对每个第一类风险因子返回相应风险控制措施;在风险预防决策中,通过在检索系统中检索每一个未发现的第一类风险因子,按照第一类风险因子发生概率对其进行排序,根据排序结果对每一类风险因子返回相应风险预防措施。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,包含如下内容:
构建由实体、属性及关系组成的输水建筑物知识图谱并利用数据库进行数据存储,其中,实体至少包含:建筑物、第一类风险因子、风险预防和/或处置措施,关系至少包含:基于事故致因理论,由实体中第一类风险因子导致或后继引起另一种第一类风险因子的第二类风险因子,及对第一类风险因子的预防或处置措施,属性包含:第一类风险因子和第二类风险因子两者的发生概率;
抽取输水建筑物知识图谱中实体关系三元组,并进行数据融合获取规范统一的实体关系描述;
基于所构建的知识图谱,结合建筑物运行环境和状况,对第一类风险因子和第二类风险因子进行风险识别分析,根据风险识别分析结果并利用路径搜索方法来评估未知风险因子的发生风险值,其中,风险识别分析包括:分析第一类风险因子(物质或能量)是否存在及第二类风险因子的发生概率;
基于所构建知识图谱,结合风险识别分析结果和风险评估结果来获取已知风险因子的处置措施决策和未知风险因子的预防措施决策。
2.根据权利要求1所述的基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,采用开源数据库对输水建筑物知识图谱及原始数据进行数据存储。
3.根据权利要求1或2所述的基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,采用人工标注和机器学习相结合的方式抽取输水建筑物知识图谱中所需的实体关系三元组。
4.根据权利要求1所述的基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,利用聚类算法和/或链接方式进行实体消岐的数据融合,获取规范统一的实体关系描述。
5.根据权利要求4所述的基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,利用聚类算法进行实体消岐的数据融合时,通过获取目标实体向量语义特征及其上下文信息,基于语义相似度对关联实体进行聚类来进行数据融合。
6.根据权利要求4所述的基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,利用链接方式进行实体消岐的数据融合时,针对目标实体利用知识和/或人工规则及上下文信息从数据库中获取候选实体;并根据目标实体与候选实体之间的相似度特征来选取相似度最大的候选实体进行链接。
7.根据权利要求1所述的基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,根据所构建的知识图谱进行建筑物风险分析,首先依据建筑物运行状况识别第一类风险因子节点是否出现,以及第二类风险因子发生的可能性,然后通过路径搜索方法评估未出现第一类风险因子或事故的发生概率;根据第一类风险因子的识别和分析结果,依据节点出入度或出现概率,对相关的风险源实体及事故进行排序来获取第一类风险因子对应的预防控制措施,其中,第一类风险因子为生产过程中存在因意外释放的能量或危险物质,第二类风险因子为导致能量或危险物质约束/限制措施破坏/失效的因素。
8.根据权利要求1或7所述的基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,获取处置决策和预防措施中,利用网络节点出入度排序方法对已知风险因子的处置措施进行排序来获取已知风险因子的处置决策结果;根据未知风险因子的发生概率对未知风险因子的预防措施进行排序来获取未知风险因子的的预防措施。
10.根据权利要求1或7所述的基于知识图谱的输水建筑物风险评估与防范方法,其特征在于,获取已知风险因子的处置决策和未知风险因子的预防措施中,根据知识图谱中每个节点出入度,按照由大到小对所有已发现第一类风险因子的网络节点进行排序,查询前K个节点所关联的处置措施节点内容,并确定作为已知风险因子的处置决策结果;并按照知识图谱中每个网络节点出现概率的大小,按照由大到小对所有未发现第一类风险因子的网络节点进行排序,查询前K个节点所关联的预防措施节点内容,并确定作为未知风险因子的预防措施结果,其中,K为预设值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111504430.3A CN114358507A (zh) | 2021-12-10 | 2021-12-10 | 基于知识图谱的输水建筑物风险评估与防范方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111504430.3A CN114358507A (zh) | 2021-12-10 | 2021-12-10 | 基于知识图谱的输水建筑物风险评估与防范方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114358507A true CN114358507A (zh) | 2022-04-15 |
Family
ID=81099037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111504430.3A Pending CN114358507A (zh) | 2021-12-10 | 2021-12-10 | 基于知识图谱的输水建筑物风险评估与防范方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114358507A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116150929A (zh) * | 2023-04-17 | 2023-05-23 | 中南大学 | 一种铁路选线知识图谱的构建方法 |
CN116432953A (zh) * | 2023-03-24 | 2023-07-14 | 武汉旗云高科工程技术有限公司 | 基于泛化生成模式的文物保护应急响应决策方法和系统 |
CN117634894A (zh) * | 2024-01-25 | 2024-03-01 | 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) | 生态环境风险评估方法、装置、电子设备及存储介质 |
CN118096445A (zh) * | 2024-04-25 | 2024-05-28 | 北京大学 | 知识图谱驱动的面向地下水的建筑风险预警方法及装置 |
-
2021
- 2021-12-10 CN CN202111504430.3A patent/CN114358507A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116432953A (zh) * | 2023-03-24 | 2023-07-14 | 武汉旗云高科工程技术有限公司 | 基于泛化生成模式的文物保护应急响应决策方法和系统 |
CN116432953B (zh) * | 2023-03-24 | 2023-09-15 | 武汉旗云高科工程技术有限公司 | 基于泛化生成模式的文物保护应急响应决策方法和系统 |
CN116150929A (zh) * | 2023-04-17 | 2023-05-23 | 中南大学 | 一种铁路选线知识图谱的构建方法 |
CN117634894A (zh) * | 2024-01-25 | 2024-03-01 | 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) | 生态环境风险评估方法、装置、电子设备及存储介质 |
CN117634894B (zh) * | 2024-01-25 | 2024-05-10 | 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) | 生态环境风险评估方法、装置、电子设备及存储介质 |
CN118096445A (zh) * | 2024-04-25 | 2024-05-28 | 北京大学 | 知识图谱驱动的面向地下水的建筑风险预警方法及装置 |
CN118096445B (zh) * | 2024-04-25 | 2024-07-16 | 北京大学 | 知识图谱驱动的面向地下水的建筑风险预警方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114358507A (zh) | 基于知识图谱的输水建筑物风险评估与防范方法 | |
Xing et al. | Ontology for safety risk identification in metro construction | |
Ghasemi et al. | Evaluation of rockburst occurrence and intensity in underground structures using decision tree approach | |
CN109614501B (zh) | 一种基于知识图谱的工业隐患规范化上报方法及系统 | |
Xu et al. | Extracting domain knowledge elements of construction safety management: Rule-based approach using Chinese natural language processing | |
JP5904559B2 (ja) | シナリオ生成装置、及びそのためのコンピュータプログラム | |
Martínez-Rojas et al. | Management of construction Safety and Health Plans based on automated content analysis | |
Komendantova et al. | Multi-risk approach and urban resilience | |
CN113688169B (zh) | 基于大数据分析的矿山安全隐患辨识与预警系统 | |
Assaad et al. | Evaluation and prediction of the hazard potential level of dam infrastructures using computational artificial intelligence algorithms | |
KR102396771B1 (ko) | 재난원인 정보 자동 추출 방법 | |
Li et al. | MetaInjury: Meta-learning framework for reusing the risk knowledge of different construction accidents | |
CN115525766A (zh) | 污染场地知识图谱的构建方法和装置 | |
Schröder et al. | Supporting land reuse of former open pit mining sites using text classification and active learning | |
Pollach et al. | Web content mining for comparing corporate and third‐party online reporting: a case study on solid waste management | |
Luo et al. | Convolutional neural network algorithm–based novel automatic text classification framework for construction accident reports | |
Abdel-Basset et al. | An effective analysis of risk assessment and mitigation strategies of photovoltaic power plants based on real data: strategies, challenges, perspectives, and sustainability | |
Wang et al. | Risk assessment of coal mine safety production management activities based on FMEA-BN | |
He et al. | Integration of interpretive structural modeling with fuzzy Bayesian network for risk assessment of tunnel collapse | |
Perfectson | Environmental and Information Safety of End-of-Life Electronics | |
Liao et al. | CBR respond and preparedness system development for environmental emergency | |
KR20170131047A (ko) | 화학 사고에 영향을 주는 환경위험지수 산출 방법 | |
CN115936932A (zh) | 司法文书的处理方法、装置、电子设备和存储介质 | |
Akinyokun et al. | Experimental study of neuro-fuzzy-genetic framework for oil spillage risk management. | |
Pérez-Castillo et al. | Obtaining thresholds for the effectiveness of business process mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |