CN115049124A - 一种基于贝叶斯网络的深长隧道突涌水预测方法 - Google Patents

一种基于贝叶斯网络的深长隧道突涌水预测方法 Download PDF

Info

Publication number
CN115049124A
CN115049124A CN202210644546.5A CN202210644546A CN115049124A CN 115049124 A CN115049124 A CN 115049124A CN 202210644546 A CN202210644546 A CN 202210644546A CN 115049124 A CN115049124 A CN 115049124A
Authority
CN
China
Prior art keywords
bayesian network
node
model
water
inrush
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210644546.5A
Other languages
English (en)
Inventor
汪洪星
赵田甜
巫尚蔚
敬小非
刘克辉
任凌燕
崔永鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Science and Technology
Original Assignee
Chongqing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Science and Technology filed Critical Chongqing University of Science and Technology
Priority to CN202210644546.5A priority Critical patent/CN115049124A/zh
Publication of CN115049124A publication Critical patent/CN115049124A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Examining Or Testing Airtightness (AREA)

Abstract

本发明属于隧道工程灾害预测领域,具体涉及一种基于贝叶斯网络的深长隧道突涌水预测方法,包括确定深长隧道突涌水的影响因素,完善致灾因子和突涌水评价指标的等级划分,建立隧道突涌水样本库;应用解释结构模型方法建立突涌水影响因素的层次结构关系,确定影响因素的排序和层间指向性连接,建立解释结构模型;基于解释结构模型,改进贝叶斯网络结构的构建方法;针对不同样本库的情况,应用改进方法构建贝叶斯网络模型;依据贝叶斯网络模型,进行深长隧道突涌水的定量预测。本发明能够实现定性和定量的综合分析,对完备数据样本和不完备数据样本同时具有适用性,对小样本具有适用性,独立于主观判断,更准确、更客观的进行深长隧道突涌水预测。

Description

一种基于贝叶斯网络的深长隧道突涌水预测方法
技术领域
本发明属于隧道工程灾害预测领域,具体为一种基于贝叶斯网络的深长隧道突涌水预测方法。
背景技术
近年来,我国基础设施建设发展迅速,交通、水利水电等重大工程建设的需求增加。作为交通、水利水电等重大工程的关键控制性工程,隧道的建设也得到了迅速发展。隧道工程在建设的过程中经常会遇到各种地质灾害,造成工期延误、经济损失、人员伤亡等危害。其中,突涌水灾害约占各类隧道灾害的40%,是不容忽视、亟待解决的安全问题。
而随着西部大开发的推进,大量的重大交通工程和水利工程,催生了大量的深长隧道的建设。深长隧道穿越的自然环境更加复杂,突涌水灾害发生的频率更大,突涌水灾害导致的损伤也更加严重。
为了保证隧道施工的安全性、避免人员伤亡和减少不必要的经济损失,提前预测突涌水的发生,从而合理选择预防措施是十分重要的。对此,许多国内外专家进行了广泛的研究,并取得了大量的成果。从早期单纯定性地对突涌水进行预测,发展到现如今能对突涌水进行定量的评估和计算。现在的定量分析结果相对于定性分析结果,其科学性已经得到了很大的提高。
但由于深长隧道突涌水涉及的影响因素包含定性变量和定量变量,很多方法不具备同时处理两种类型变量训练学习的能力。有些可以处理包含定性和定量变量训练学习的方法,或多或少都有其局限性。如神经网络,具备对两种变量训练学习的能力,但其所需样本数量大,计算收敛速度慢,容易陷入局部最小,从而影响模型训练结果。
由于深长隧道工程的复杂性,隧道突涌水样本数据难以完整收集。一方面,隧道工程突涌水影响因素众多,导致多数情况下收集的样本不完备,缺少一个或者多个影响因素的取值。另外一方面,收集的样本数量不够多,属于小样本。常规的机器学习算法,如神经网络方法和、故障树等方法,不具备处理不完备小样本的能力。
因此,建立一种能够同时处理定性变量和定量变量,对包含完备样本和不完备样本的小样本具有适用性的学习方法,对于深长隧道突涌水的预测,具有非常重要的价值。
发明内容
针对以上不足,本发明提出了基于贝叶斯网络的深长隧道突涌水预测方法,该方法基于统计的深长隧道突涌水案例,构建样本库;应用解释结构模型的方法,确定影响因素之间的解释结构模型;基于解释结构模型确定的层次结构关系和变量因果关系,改进贝叶斯网络模型结构的构建方法,构建深长隧道突涌水预测的贝叶斯网络模型。
本发明一种基于贝叶斯网络的深长隧道突涌水预测方法,包括以下步骤:
S1:确定引发突涌水的影响因素;
S2:对突涌水影响因素进行等级划分,对最大集中涌水量进行区间划分,形成深长隧道突涌水样本库;
S3:应用解释结构模型方法,将深长隧道突涌水的系统问题转化成一个多级递阶的层次结构图,确定层间的指向性连接,建立影响因素的解释结构模型;
S4:根据解释结构模型,改进贝叶斯网络结构的学习方法;基于改进的学习方法,构建贝叶斯网络模型结构;
S5:基于参数学习方法,构建贝叶斯网络模型的条件概率表;
S6:进行贝叶斯网络模型推理,构建深长隧道的突涌水预测模型;
S7:依据建立的突涌水预测模型,进行新建隧道的突涌水预测。
本发明优选的实施方式在于:在S1中,所述的影响因素包括埋深、地形地貌、岩层产状、地层岩性、不良地质、围岩级别、层间裂隙、可溶岩与非可溶岩接触带、地下水位、一周内降雨量、施工扰动程度、支护措施共12个影响因素。
本发明优选的实施方式在于:在S4中,基于影响因素的解释结构模型,确定贝叶斯网络结构学习方法的节点排序,以及确定每个节点允许的最大父节点数量为4。
本发明优选的实施方式在于:
在S4中,基于影响因素的解释结构模型,提前指定部分贝叶斯网络节点之间的指向性联系。
本发明优选的实施方式在于:
在S4中,对于完备样本,基于解释结构模型对基于评分搜索的K2算法进行优化;基于优化K2算法得到贝叶斯网络模型结构,具体的计算过程为:
确定评分函数,用P(G,D)作为评分函数,公式为:
Figure BDA0003683560070000021
Figure BDA0003683560070000022
其中,评分函数各变量含义如下:D:数据集;G:拟选的网络模型;n:变量个数;P(G):网络结构G的先验概率分布;ri:变节点xi的取值数量;i:节点的编号;j:节点xi的父节点的取值编号;π(xi):节点xi的父节点;qi:π(xi)的取值数量;Nijk:节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;Nij:节点xi父节点集π(xi)的第j个状态组合所对应的样本数量;
根据贝叶斯网络结构学习方法的节点排序,以及每个节点允许的最大父节点数量为4,确定节点的编号i(1,,2,3...13)的取值和qi的取值;
根据提前指定的部分贝叶斯网络节点之间的指向性联系,确定部分π(xi)的取值;
确定搜索策略为贪婪搜索算法;搜索将评分函数最大的父节点变量放入集合;当无法使评分函数增大时,停止搜索,则找到最优的模型;
基于训练集的样本数据,通过上述优化的K2算法,建立贝叶斯网络模型结构。
本发明优选的实施方式在于:
在S4中,对于不完备样本,基于解释结构模型对基于评分搜索的EM算法进行优化;基于训练集的样本数据,通过上述优化的EM算法,建立贝叶斯网络模型结构。
EM算法本身就是K2算法的一个改进;主要改进内容是基于迭代计算进行缺失数据的补充,其他的计算原理和应用逻辑是一样的。基于解释结构模型,对EM算法进行优化,其优化过程也与K2算法的优化过程相同。鉴于EM算法与K2算法相同的计算原理和应用逻辑,此处不再对EM算法的优化过程进行详细阐述。
本发明优选的实施方式在于:
在S5中,对于完备样本库,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建;对于不完备样本库,采用期望极大化法进行贝叶斯网络模型的条件概率表的构建。
本发明优选的实施方式在于:
在S5中,对于完备样本,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建,具体方法是:
确定似然度的对数函数形式为:
Figure BDA0003683560070000031
其中,N为样本数据,n为节点xi的个数;令节点xi的父节点为π(xi),qi为父节点π(xi)的取值数量,ri为变节点xi的取值数量;Nijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;θijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时所对应的参数值,
Figure BDA0003683560070000032
对上述对数函数求取最大值,即对参数θ求导得到最大值,即可以得到参数θijk的取值为:
Figure BDA0003683560070000033
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表。
本发明优选的实施方式在于:
在S5中,对于不完备样本库,采用期望极大化法进行贝叶斯网络模型的条件概率表的构建。期望极大化算法实质上为最大似然估计法的改进算法,主要思想是通过迭代计算对样本缺省数据进行补充,其具体计算方法为:
(1)令X表示已观测变量集,Z表示不完备样本库中未观测变量集,也称隐变量集,Θ表示模型参数。对模型参数Θ做最大似然估计,即:
LL(Θ|X,Z)=logP(X,Z|Θ);
(2)以初始值Θ0为起点,对上式迭代执行E步和M步直至收敛;
(3)E步:基于Θt推断隐变量Z的期望,记为Zt
(4)M步:基于已观测变量X和Zt对参数做最大似然估计,记为Θt+1
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表。
本发明优选的实施方式在于:在S6中,对贝叶斯网络进行推理学习,其具体计算过程如下:
假设贝叶斯网络模型的最大集中涌水量用变量D表示,影响因素简化为用A,B,C表示;A为根节点,D为叶节点,A为B和C的父节点,B和C分别为D的父节点。已知影响因素A,B,C的取值,计算最大集中涌水量的计算方法为:P(D/A,B,C)=P(D)*P(A,B,C/D)/P(A,B,C),此时,A,B,C之间并不相互独立。因为在贝叶斯网络模型中建立了A,B,C三个节点间的关系,则可以有效的对上述关系进行深入的分析,此时,需要引入另外一个马尔科夫链规则公式:
P(x1,...,xn)=P(x1)P(x2|x1)...P(xn|x1,x2,...,xn-1)
其中,x1,...,xn表示贝叶斯网络的各个节点变量,上述链规则表示,在对变量进行科学的排序的基础上,各个变量的联合概率分布,等于每一个变量的条件概率的乘积,因此,对于上述公式P(D|A,B,C)=P(D)*P(A,B,C|D)/P(A,B,C),可以做进一步的分析,如下:
Figure BDA0003683560070000041
Figure BDA0003683560070000042
P(A,B,C|D)=P(A,B,C,D)/P(D)=P(A).P(B|A)P(C|A,B)P(D/A,B,C)/P(D)
上述三个公式中,先验概率(即边缘概率)可以从样本库中直接获取,而条件概率需要做进一步的分析,此时,根据贝叶斯网络中的各个变量间的依存关系,引入如下所示的条件独立性公式,
Figure BDA0003683560070000043
其中,π(xi)为变量xi的父节点的集合,此时,上述公式中的每一个条件概率的条件项,仅仅保留其父节点项,而剔除了其他的项,此时,每一个条件概率都可以从贝叶斯网络的节点参数CPT中获取,从而实现公式的计算,
Figure BDA0003683560070000044
Figure BDA0003683560070000045
Figure BDA0003683560070000046
从而可以得到:
Figure BDA0003683560070000051
D P(A).P(B|A)P(C|A)P(D|B,C)=
P(A)P(B|A)P(C|B)P(D/B,C)/∑D P(A).P(B|A)P(C|A)P(D|B,C)。
本发明具备如下突出的技术优势:
本发明利用贝叶斯网络模型的学习与推理的能力,实现了突涌水预测分析,解决了定性变量和定量变量混杂、不完备小样本等带来的不良影响,从不完全、不精确或不确定的信息中做出准确推理,提高了隧道突涌水预测的准确性,对隧道突涌水分析具有重要的科学价值和实用价值。
本发明结合解释结构模型和评分搜索算法,进行贝叶斯网络模型结构的构建,一方面可以克服解释结构模型构建的网络结构的结构跨层不连接的缺点;另外一方面可以解决常规评分算法在确定节点顺序和节点最大父节点数量时的主观性,同时可以减小常规评分算法的搜索范围,提高搜索效率。相对于传统方法,本发明的贝叶斯网络模型结构的构建方法,具有更好的客观性、科学性和高效率。
附图说明
图1为本发明基于贝叶斯网络的深长隧道突涌水预测方法实施例一和实施例二的流程图;
图2为本发明实施例一的解释结构模型图;
图3为本发明实施例一和实施例二的贝叶斯网络模型结构图;
图4为本发明实施例一的贝叶斯网络模型的条件概率表;
图5为本发明实施例一的贝叶斯网络模型简化示意图;
图6为本发明实施例二的贝叶斯网络模型的条件概率表。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明,应当理解,下述所描述的优选实施例仅用于对本发明进行解释说明,并不会对本发明的保护范围起到限定作用。
实施例一
本实施例所公开的基于贝叶斯网络的深长隧道突涌水预测方法,具体包括以下内容:
步骤1:根据工程勘察资料及相关文献资料,确定12个引发突涌水的影响因素:隧道埋深、地形地貌、岩层产状、地层岩性、不良地质、围岩级别、层间裂隙、可溶岩与非可溶岩接触带、地下水位、一周内降雨量、施工扰动程度、支护措施,以最大集中涌水量作为隧道突涌水的评价指标。本发明可不限于上述12个突涌水的影响因素,还可以包括其他的影响因素。
步骤2:根据步骤1确定的影响因素,采集数据,形成案例库。基于相关文献、专家经验、工程规范、工程实践情况和工程需要,对影响因素致灾等级进行定性和定量划分,如表1所示为突涌水影响因素等级划分表;如表2所示为对最大集中涌水量进行区间划分。
表1
Figure BDA0003683560070000061
表2
Figure BDA0003683560070000071
基于上述影响因素和评价指标的等级划分和区间划分,对案例库进行处理,形成满足贝叶斯网络模型要求的样本库。
步骤3:建立解释结构模型,对影响因素间的相互关系进行处理,将系统问题转化成一个多级递阶的层次结构图。
步骤3中,具体步骤如下:
(1)选择构成系统的影响关键问题的有关变量:
步骤1中已经确定了适用于隧道突涌水预警的12个输入指标和1个输出指标,将其进行编码,分别为:埋深S1、地形地貌S2、岩层产状S3、地层岩性S4、不良地质S5、围岩级别S6、层间裂隙S7、可溶岩与非可溶岩接触带S8、地下水位S9、一周内降雨量S10、施工扰动程度S11、支护措施S12、最大集中涌水量S13
(2)通过专家经验确定变量间的因果关系,建立变量关系表:
根据领域知识、实践经验或者专家咨询等方式确定变量间的因果关系,如表3。C表示横排因素影响纵排因素,L表示纵排因素影响横排因素,X表示两个因素之间没有关系,O表示两个因素相互影响。表3为突涌水重要影响因素的相互关系。
表3
S<sub>1</sub> S<sub>2</sub> S<sub>3</sub> S<sub>4</sub> S<sub>5</sub> S<sub>6</sub> S<sub>7</sub> S<sub>8</sub> S<sub>9</sub> S<sub>10</sub> S<sub>11</sub> S<sub>12</sub> S<sub>13</sub>
X X X X X X X C X X X C S<sub>1</sub>
X L X C C C C X X X C S<sub>2</sub>
X X X X C X X X X C S<sub>3</sub>
L X C C C X X C C S<sub>4</sub>
C L L X X X X C S<sub>5</sub>
X C L X X X C S<sub>6</sub>
C C X X X X S<sub>7</sub>
X X X X C S<sub>8</sub>
L X X C S<sub>9</sub>
C C C S<sub>10</sub>
C C S<sub>11</sub>
C S<sub>12</sub>
S<sub>13</sub>
(3)把变量之间的因果关系图转化成邻接矩阵A:
A=(aij)N×N,其中N=13,
Figure BDA0003683560070000081
转化后得到的邻接矩阵为:
Figure BDA0003683560070000082
(4)通过矩阵运算求出该系统的可达矩阵R:
根据布尔矩阵的运算法则,设I为单位矩阵,进行矩阵A+I的幂运算,当A+I≠(A+I)2≠……≠(A+I)n-1=(A+I)n时,得到可达矩阵R=(A+I)n。计算得到可达矩阵为:
Figure BDA0003683560070000091
(5)对可达矩阵R进行区域分解和级间分解:
分别求影响因素Si的可达集R(Si)和前因集Q(Si),当R(Si)∩Q(Si)=R(Si)时,Si为当前符合条件的最高级要素,先找出符合条件的最高级要素,将它们从可达矩阵中划去得到一个新的矩阵,然后再找到新矩阵中符合条件的最高级要素,用该方法层层递进得到最终的影响因素层级划分,见表4。表4为可达矩阵层级划分表。
表4
Figure BDA0003683560070000092
Figure BDA0003683560070000101
(6)建立解释结构模型:
根据可达矩阵层级划分表和影响因素之间的因果关系,绘制解释结构模型,如附图2所示。
其中,最大集中涌水量属于第一层,支护措施、不良地质、围岩级别和地下水位属于第二层,施工扰动程度、可溶岩与非可溶岩接触带、一周降雨量和埋深属于第三层,岩层产状和层间裂隙属于第四层,地形地貌属于第五层,地层岩性属于第六层。
步骤4:采用众数插补法对不完备数据进行填充,形成完备样本库。
步骤5:将完备样本库进行训练集和测试集划分,以完备样本库的80%作为训练集,20%作为测试集。
步骤6:使用K2算法进行结构学习;根据解释结构模型,确定节点顺序,如表5所示为节点顺序表。根据解释结构模型图,确定每个节点允许的最大父节点数量为4。为避免忽略影响因素间的重要连接关系,根据解释结构模型,提前指定部分影响因素间的指定性连接,如表6所示为指向性连接关系表。
表5
顺序号 因素名称
1 地层岩性
2 地形地貌
3 岩层产状
4 层间裂隙
5 可溶岩与非可溶岩接触带
6 埋深
7 一周降雨量
8 施工扰动程度
9 地下水位
10 支护措施
11 围岩级别
12 不良地质
13 最大集中涌水量
表6
指向性连接关系 dag=1 dag=0
dag[1,2]
dag[2,4]
dag[(3,4),5]
dag[(9,10,11,12),13]
dag[7,13]
dag[7,3]
dag[7,6]
表6中,dag表示有向无环图;dag=1指节点间存在指向性连接;dag=0指节点间不存在指向性连接。如dag[1,2]=1表示存在地层岩性(节点序号为1)指向地形地貌(节点序号为2)的连接,dag[7,3]=0表示一周降雨量(节点序号为7)与岩层产状间(节点序号为3)不存在指向性连接关系。其他的没有指定的节点关系,通过数据学习进行确定。
步骤7:基于解释结构模型,对基于评分搜索的K2算法进行优化;基于优化K2算法,得到贝叶斯网络模型结构,具体的计算过程为:
(1)确定评分函数,用P(G,D)作为评分函数,公式为:
Figure BDA0003683560070000121
Figure BDA0003683560070000122
表7为评分函数各变量含义。
表7
Figure BDA0003683560070000123
(2)根据步骤6,确定节点的编号i(1,,2,3...13)的取值如表5所示,qi的最大取值为4。根据步骤6,确定部分π(xi)的取值如表6所示。确定搜索策略为贪婪搜索算法;搜索将评分函数最大的父节点变量放入集合;当无法使评分函数增大时,停止搜索,则可以找到最优的模型。
基于训练集的样本数据,通过上述优化的K2算法,建立贝叶斯网络模型结构,如附图3所示。
步骤8:对于完备样本库,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建;对于不完备样本库,采用期望极大化法进行贝叶斯网络模型的条件概率表的构建。
对于完备样本,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建,具体方法是:
确定似然度的对数函数形式为:
Figure BDA0003683560070000131
其中,N为样本数据,n为节点xi的个数;令节点xi的父节点为π(xi),qi为父节点π(xi)的取值数量,ri为变节点xi的取值数量;Nijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;θijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时所对应的参数值,
Figure BDA0003683560070000132
对上述对数函数求取最大值,即对参数θ求导得到最大值,即可以得到参数θijk的取值为:
Figure BDA0003683560070000133
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表,如附图4所示。
附图4中,鉴于条件概率表过大,仅给出了通过条件概率表计算得到的边缘概率表,通过边缘概率来表示条件概率。
步骤9:对贝叶斯网络进行推理学习,其具体计算过程如下:
假设本发明的贝叶斯网络模型的最大集中涌水量用变量D表示,影响因素简化为用A,B,C表示,假设建立的贝叶斯网络模型为附图5所示的简化模型。根据这个简化模型的计算过程,解释贝叶斯网络模型的推理计算过程。
贝叶斯网络模型是在贝叶斯定理的基础上发展而来的。经典的贝叶斯定理具体表达式为:
Figure BDA0003683560070000134
式中,X为证据项,Y为目标项;P(Y|X=e)为后验概率,是已知X的某个新证据e情况下Y发生的概率;P(Y)为先验概率,是考虑X的新证据e之前变量Y的概率,可以根据历史数据学习获得;P(X=e|Y)为Y的似然度,也是一个条件概率,一般基于历史数据计算得到;P(X=e)为X的新证据发生的概率。
按照经典贝叶斯方法,在已知影响因素的取值,计算最大集中涌水量的计算方法为:P(D/A,B,C)=P(D)*P(A,B,C/D)/P(A,B,C)。此时,由于A,B,C之间并不相互独立,则经典贝叶斯方法无法继续进行分析:无法求取P(A,B,C/D)和P(A,B,C)的值。但是,因为在贝叶斯网络模型中建立了A,B,C三个节点间的关系,则可以有效的对上述关系进行深入的分析。此时,需要引入另外一个公式——马尔科夫链规则:
P(x1,...,xn)=P(x1)P(x2|x1)...P(xn|x1,x2,...,xn-1)
其中,x1,...,xn表示贝叶斯网络的各个节点变量。
上述链规则表示,在对变量进行科学的排序的基础上,各个变量的联合概率分布,等于每一个变量的条件概率的乘积。因此,对于上述公式P(D|A,B,C)=P(D)*P(A,B,C|D)/P(A,B,C),可以做进一步的分析,如下:
Figure BDA0003683560070000141
Figure BDA0003683560070000142
P(A,B,C|D)=P(A,B,C,D)/P(D)=P(A).P(B|A)P(C|A,B)P(D/A,B,C)/P(D)
上述三个公式中,P(A)等先验概率(边缘概率)可以从样本库中直接获取,而条件概率需要做进一步的分析。此时,根据贝叶斯网络中的各个变量间的依存关系,引入如下所示的条件独立性公式。
Figure BDA0003683560070000143
其中,π(xi)为变量xi的父节点的集合。此时,上述公式中的每一个条件概率的条件项,仅仅保留其父节点项,而剔除了其他的项。此时,每一个条件概率都可以从贝叶斯网络的节点参数CPT中获取,从而实现公式的计算。
Figure BDA0003683560070000144
Figure BDA0003683560070000145
Figure BDA0003683560070000146
从而可以得到:
Figure BDA0003683560070000151
一般的情况下,贝叶斯网络可以通过变量消元法、团树传播法等方法对上述公式进行精确的推理和演算,得到目标项的状态概率;如果模型过于庞大,计算过于复杂,可以使用多树传播法等近似方法进行计算。计算方法的选择,只会影响计算效率,不会影响最终的结果。本发明基于上述建立的贝叶斯网络模型结构和条件概率表,使用团树传播法进行推理计算,建立贝叶斯网络模型的逻辑推理关系。
步骤10:将测试集样本数据代入到贝叶斯网络模型中,根据测试集样本数据的证据项,求解其目标项最大集中涌水量,进行贝叶斯网络模型的测试验证。
表8为基于实施例一的方案得到的测试结果。
表8
Figure BDA0003683560070000152
实施例二
本实施例公开的基于贝叶斯网络的深长隧道突涌水预测方法,包括如下步骤:
步骤1、2、3与实施例一步骤1、2、3相同。
通过步骤1、2、3,建立深长隧道突涌水的影响因素的解释结构模型。
步骤4:将不完备样本库进行训练集和测试集划分,以样本库的80%作为训练集,20%作为测试集。
步骤5:基于解释结构模型对基于评分的EM算法进行优化;基于优化EM算法,进行贝叶斯网络模型的结构学习。
EM算法本身就是K2算法的一个改进;主要改进内容是基于迭代计算进行缺失数据的补充,其他的计算原理和应用逻辑是一样的。基于解释结构模型的优化方法,主要包括确定节点顺序、节点的最大父节点数量和部分节点指向性连接,其优化过程与K2算法的优化过程相同。鉴于EM算法与K2算法相同的计算原理和应用逻辑,此处不再对EM算法的优化过程进行详细阐述。
基于训练集的样本数据,通过上述优化的EM算法,建立贝叶斯网络模型结构,如附图3所示。
优化EM算法建立的贝叶斯网络模型结构,与实施例一中优化K2算法建立的结构相同,互相印证了两种算法的正确性和可靠性。
步骤6:采用期望极大化法算法对贝叶斯网络模型进行参数学习,期望极大化算法实质上为最大似然估计法的改进算法,主要思想是通过迭代计算对样本缺省数据进行补充,其具体计算思路为:
(1)令X表示已观测变量集,Z表示不完备样本库中未观测变量集,也称隐变量集,Θ表示模型参数。对模型参数Θ做最大似然估计,即:
LL(Θ|X,Z)=logP(X,Z|Θ);
(2)以初始值Θ0为起点,对上式迭代执行E步和M步直至收敛;
(3)E步:基于Θt推断隐变量Z的期望,记为Zt
(4)M步:基于已观测变量X和Zt对参数做最大似然估计,记为Θt+1
基于训练集样本数据,通过上述方法建立贝叶斯网络模型的条件概率表,如附图6所示。
步骤7:贝叶斯网络模型的推理计算原理和方法,与实施例一步骤9相同。
步骤8:将测试集样本数据带入到模型中,根据样本数据的证据项,计算样本数据的目标项——最大集中突涌水,进行贝叶斯网络结构模型的测试验证。
表9为采用实施例二的方案得到的测试结果。
表9
Figure BDA0003683560070000161
选用常用的机器学习算法支持向量机与BP神经网络,针对同一样本库,同一训练集和测试集比例,对深长隧道突涌水进行预测,结果如表10所示。可见,贝叶斯网络模型的预测能力要优于支持向量机和BP神经网络。
表10为各深长隧道突涌水预测方法结果对比表。
表10
Figure BDA0003683560070000162
本发明针对深长隧道工程突涌水影响因素复杂多样、样本采集困难、样本数据不完整等工程特征,实现了基于贝叶斯网络的深长隧道突涌水预测,具有很强的工程适用性。
以上结合附图详细阐述了本申请的优选实施方式,优选实施方式中典型的公知结构及公知性常识技术在此未作过多描述,所属领域普通技术人员可以在本实施方式给出的启示下,结合自身能力完善并实施本发明技术方案,一些典型的公知结构、公知方法或公知性常识技术不应当成为所属领域普通技术人员实施本申请的障碍。
本申请要求的保护范围应当以其权利要求书的内容为准,发明内容、具体实施方式及说明书附图记载的内容用于解释权利要求书。
在本申请的技术构思范围内,还可以对本申请的具体实施方式作出若干变型,这些变型后的具体实施方式也应该视为在本申请的保护范围内。

Claims (10)

1.一种基于贝叶斯网络的深长隧道突涌水预测方法,其特征在于,包括以下步骤:
S1:确定引发突涌水的影响因素;
S2:对突涌水影响因素进行等级划分,对最大集中涌水量进行区间划分,形成深长隧道突涌水样本库;
S3:应用解释结构模型方法,将深长隧道突涌水的系统问题转化成一个多级递阶的层次结构图,确定层间的指向性连接,建立影响因素的解释结构模型;
S4:根据解释结构模型,改进贝叶斯网络结构的学习方法;基于改进的学习方法,构建贝叶斯网络模型结构;
S5:基于参数学习方法,构建贝叶斯网络模型的条件概率表;
S6:进行贝叶斯网络模型推理,构建深长隧道的突涌水预测模型;
S7:依据建立的突涌水预测模型,进行新建隧道的突涌水预测。
2.根据权利要求1所述的基于贝叶斯网络的突涌水预测方法,其特征在于:在S1中,所述的影响因素包括埋深、地形地貌、岩层产状、地层岩性、不良地质、围岩级别、层间裂隙、可溶岩与非可溶岩接触带、地下水位、一周内降雨量、施工扰动程度、支护措施共12个影响因素。
3.根据权利要求1所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S4中,基于影响因素的解释结构模型,确定贝叶斯网络结构学习方法的节点排序,以及确定每个节点允许的最大父节点数量为4。
4.根据权利要求3所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S4中,基于影响因素的解释结构模型,提前指定部分贝叶斯网络节点之间的指向性联系。
5.根据权利要求3或4所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S4中,对于完备样本,基于解释结构模型对基于评分搜索的K2算法进行优化;基于优化的K2算法,得到贝叶斯网络模型结构,具体的计算过程为:
确定评分函数,用P(G,D)作为评分函数,公式为:
Figure FDA0003683560060000011
Figure FDA0003683560060000012
其中,评分函数各变量含义如下:D:数据集;G:拟选的网络模型;n:变量个数;P(G):网络结构G的先验概率分布;ri:变节点xi的取值数量;i:节点的编号;j:节点xi的父节点的取值编号;π(xi):节点xi的父节点;qi:π(xi)的取值数量;Nijk:节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;Nij:节点xi父节点集π(xi)的第j个状态组合所对应的样本数量;
根据贝叶斯网络结构学习方法的节点排序,以及每个节点允许的最大父节点数量为4,确定节点的编号i(1,,2,3...13)的取值和qi的取值;
根据提前指定的部分贝叶斯网络节点之间的指向性联系,确定部分π(xi)的取值;
确定搜索策略为贪婪搜索算法;搜索将评分函数最大的父节点变量放入集合;当无法使评分函数增大时,停止搜索,则找到最优的模型;
基于训练集的样本数据,通过上述优化的K2算法,建立贝叶斯网络模型结构。
6.根据权利要求3或4所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S4中,对于不完备样本,基于解释结构模型对基于评分搜索的EM算法进行优化;基于训练集的样本数据,通过上述优化的EM算法,建立贝叶斯网络模型结构。
7.根据权利要求1所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S5中,对于完备样本库,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建;对于不完备样本库,采用期望极大化法进行贝叶斯网络模型的条件概率表的构建。
8.根据权利要求7所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S5中,对于完备样本,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建,具体方法是:
确定似然度的对数函数形式为:
Figure FDA0003683560060000021
其中,N为样本数据,n为节点xi的个数;令节点xi的父节点为π(xi),qi为父节点π(xi)的取值数量,ri为变节点xi的取值数量;Nijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;θijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时所对应的参数值,
Figure FDA0003683560060000022
对上述对数函数求取最大值,即对参数θ求导得到最大值,即可以得到参数θijk的取值为:
Figure FDA0003683560060000023
其中
Figure FDA0003683560060000024
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表。
9.根据权利要求7所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S5中,对于不完备样本,采用期望极大化算法进行贝叶斯网络模型的条件概率表的构建,具体计算方法为:
(1)令X表示已观测变量集,Z表示不完备样本库中未观测变量集,也称隐变量集,Θ表示模型参数。对模型参数Θ做最大似然估计,即:
LL(Θ|X,Z)=log P(X,Z|Θ);
(2)以初始值Θ0为起点,对上式迭代执行E步和M步直至收敛;
(3)E步:基于Θt推断隐变量Z的期望,记为Zt
(4)M步:基于已观测变量X和Zt对参数做最大似然估计,记为Θt+1
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表。
10.根据权利要求1所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S6中,对贝叶斯网络进行推理学习,其具体计算过程如下:
假设贝叶斯网络模型的最大集中涌水量用变量D表示,影响因素简化为用A,B,C表示;A为根节点,D为叶节点,A为B和C的父节点,B和C分别为D的父节点,已知影响因素A,B,C的取值,计算最大集中涌水量的计算方法为:P(D/A,B,C)=P(D)*P(A,B,C/D)/P(A,B,C),此时,A,B,C之间并不相互独立,因为在贝叶斯网络模型中建立了A,B,C三个节点间的关系,则可以有效的对上述关系进行深入的分析,此时,需要引入另外一个马尔科夫链规则公式:
P(x1,...,xn)=P(x1)P(x2|x1)...P(xn|x1,x2,...,xn-1)
其中,x1,...,xn表示贝叶斯网络的各个节点变量,
上述链规则表示,在对变量进行排序的基础上,各个变量的联合概率分布,等于每一个变量的条件概率的乘积,因此,对于上述公式P(D|A,B,C)=P(D)*P(A,B,C|D)/P(A,B,C),可以做进一步的分析,如下:
Figure FDA0003683560060000031
Figure FDA0003683560060000032
P(A,B,C|D)=P(A,B,C,D)/P(D)=P(A).P(B|A)P(C|A,B)P(D/A,B,C)/P(D)
上述三个公式中,先验概率可以从样本库中直接获取,而条件概率需要做进一步的分析,此时,根据贝叶斯网络中的各个变量间的依存关系,引入如下所示的条件独立性公式,
Figure FDA0003683560060000033
其中,π(xi)为变量xi的父节点的集合;此时,上述公式中的每一个条件概率的条件项,仅仅保留其父节点项,而剔除了其他的项,此时,每一个条件概率都可以从贝叶斯网络的节点参数CPT中获取,从而实现公式的计算,
Figure FDA0003683560060000034
Figure FDA0003683560060000035
Figure FDA0003683560060000041
从而可以得到:
Figure FDA0003683560060000042
CN202210644546.5A 2022-06-08 2022-06-08 一种基于贝叶斯网络的深长隧道突涌水预测方法 Pending CN115049124A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210644546.5A CN115049124A (zh) 2022-06-08 2022-06-08 一种基于贝叶斯网络的深长隧道突涌水预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210644546.5A CN115049124A (zh) 2022-06-08 2022-06-08 一种基于贝叶斯网络的深长隧道突涌水预测方法

Publications (1)

Publication Number Publication Date
CN115049124A true CN115049124A (zh) 2022-09-13

Family

ID=83161343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210644546.5A Pending CN115049124A (zh) 2022-06-08 2022-06-08 一种基于贝叶斯网络的深长隧道突涌水预测方法

Country Status (1)

Country Link
CN (1) CN115049124A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115392797A (zh) * 2022-10-27 2022-11-25 北京城建设计发展集团股份有限公司 基于贝叶斯网络的运营隧道结构病害快速智能诊断方法
CN117745081A (zh) * 2024-02-20 2024-03-22 中国石油大学(华东) 一种台风风暴潮灾害风险评估方法和装置
CN117853486A (zh) * 2024-03-07 2024-04-09 云南省交通规划设计研究院股份有限公司 一种数据缺失条件下隧道工作面岩体质量自动化评价方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115392797A (zh) * 2022-10-27 2022-11-25 北京城建设计发展集团股份有限公司 基于贝叶斯网络的运营隧道结构病害快速智能诊断方法
CN117745081A (zh) * 2024-02-20 2024-03-22 中国石油大学(华东) 一种台风风暴潮灾害风险评估方法和装置
CN117853486A (zh) * 2024-03-07 2024-04-09 云南省交通规划设计研究院股份有限公司 一种数据缺失条件下隧道工作面岩体质量自动化评价方法

Similar Documents

Publication Publication Date Title
CN115049124A (zh) 一种基于贝叶斯网络的深长隧道突涌水预测方法
CN110363344B (zh) 基于miv-gp算法优化bp神经网络的概率积分参数预测方法
CN109165664A (zh) 一种基于生成对抗网络的属性缺失数据集补全与预测方法
CN101093559B (zh) 一种基于知识发现的专家系统构造方法
CN110059963A (zh) 一种基于模糊多态贝叶斯网络的隧道风险评价方法
CN111079977A (zh) 基于svd算法的异构联邦学习矿井电磁辐射趋势跟踪方法
CN112949202A (zh) 一种基于贝叶斯网络的岩爆概率预测方法
KR20180116922A (ko) 쉴드 tbm의 순굴진속도 예측 장치 및 그 방법
Dorfeshan et al. A new enhanced ARAS method for critical path selection of engineering projects with interval type-2 fuzzy sets
CN105869100A (zh) 一种基于大数据思维的滑坡多场监测数据的融合及预测方法
CN115376318B (zh) 一种基于多属性融合神经网络的交通数据补偿方法
CN113779880B (zh) 一种基于超前钻探数据的隧道围岩二维质量评价方法
CN115017791A (zh) 隧道围岩级别识别方法和装置
CN113689004A (zh) 基于机器学习的地下管网承载力评价方法及系统
Qiu et al. TBM tunnel surrounding rock classification method and real-time identification model based on tunneling performance
CN116485029A (zh) 油田开发动态数据准确性检测方法、装置、设备及介质
CN116308152B (zh) 一种基于bim和激光点云数据的输电线路工程进度评估方法
Lin A VaFALCON neuro-fuzzy system for mining of incomplete construction databases
Armstrong et al. The application of data mining techniques to characterize agricultural soil profiles.
Elwakil et al. Construction knowledge discovery system using fuzzy approach
Wang et al. A fuzzy intelligent system for land consolidation–a case study in Shunde, China
CN115222196B (zh) 一种山区道路网脆弱性评估与驱动力探测方法
CN105718739A (zh) 一种巷道冒顶影响因素重要性研究方法
Peña et al. A synthesis of structural equation model-analytical hierarchy process, nonlinear autoregressive and backpropagation neural network-sensitivity analysis for construction and demolition waste assessment in the Philippines
CN115019476A (zh) 一种基于多源信息融合的滑坡时空信息监测预警方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination