CN116451582B - 基于机器学习融合模型的火灾热释放速率测量系统和方法 - Google Patents
基于机器学习融合模型的火灾热释放速率测量系统和方法 Download PDFInfo
- Publication number
- CN116451582B CN116451582B CN202310420242.5A CN202310420242A CN116451582B CN 116451582 B CN116451582 B CN 116451582B CN 202310420242 A CN202310420242 A CN 202310420242A CN 116451582 B CN116451582 B CN 116451582B
- Authority
- CN
- China
- Prior art keywords
- model
- data
- machine learning
- heat release
- release rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000004927 fusion Effects 0.000 title claims abstract description 42
- 238000005259 measurement Methods 0.000 title claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000004088 simulation Methods 0.000 claims abstract description 37
- 238000012216 screening Methods 0.000 claims abstract description 30
- 238000002474 experimental method Methods 0.000 claims abstract description 7
- 238000012360 testing method Methods 0.000 claims description 36
- 238000007637 random forest analysis Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 22
- 238000002790 cross-validation Methods 0.000 claims description 15
- 239000000779 smoke Substances 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 11
- 238000003066 decision tree Methods 0.000 claims description 10
- 238000012417 linear regression Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000000691 measurement method Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 4
- 239000000463 material Substances 0.000 claims description 3
- 238000009434 installation Methods 0.000 abstract description 2
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 18
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 229910052760 oxygen Inorganic materials 0.000 description 7
- 239000001301 oxygen Substances 0.000 description 7
- 239000012530 fluid Substances 0.000 description 5
- 230000036284 oxygen consumption Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000000446 fuel Substances 0.000 description 4
- 238000002485 combustion reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000009841 combustion method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000003546 flue gas Substances 0.000 description 1
- 239000003517 fume Substances 0.000 description 1
- 238000004868 gas analysis Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000002015 leaf growth Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N25/00—Investigating or analyzing materials by the use of thermal means
- G01N25/20—Investigating or analyzing materials by the use of thermal means by investigating the development of heat, i.e. calorimetry, e.g. by measuring specific heat, by measuring thermal conductivity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E30/00—Energy generation of nuclear origin
- Y02E30/30—Nuclear fission reactors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Geometry (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于机器学习融合模型的火灾热释放速率测量系统和方法,该系统和方法通过获取FDS模拟数据,基于FDS模拟样本数据集进行特征筛选,筛选出传感器组合;基于传感器组合进行真实火灾实验,获取真实火灾样本数据集;基于真实火灾样本数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对三个基模型进行训练,使用三个基模型的预测值加权平均,得到热释放速率预测融合模型;基于热释放速率预测融合模型对热释放速率进行预测。本发明实现了高效筛选与热释放速率相关的热电偶温度特征,降低了安装设备成本,降低了数据维度,同时提高了热释放速率预测模型的抗干扰能力以及热释放速率预测的准确性和效率。
Description
技术领域
本发明涉及一种基于机器学习融合模型的火灾热释放速率测量系统和方法,属于火灾热释放速率测量技术领域。
背景技术
热释放速率HRR是火灾最重要的参数之一,体现了火灾释放热量的能力,对于HRR的测量分析,有助于揭示火灾的危险性。因此,准确测量出火灾发生时的热释放速率对于火灾从业人员探究火灾发展规律至关重要。
目前,已有的测量热释放速率的方法包括置换燃烧法、质量损失法、氧耗法等,其中,氧耗法被广泛使用。氧耗法的原理为:对于大多数有机溶液和可燃气体,其完全燃烧时所消耗的每单位质量氧气所放出的热量基本为一个固定值。IS09705标准房间内布置的锥型量热仪即基于该原理测量火灾的热释放速率,然而,基于氧耗原理测量热释放速率时须基于气体分析等设备测量多个参数并进行计算,构建测量平台程序繁琐且造价昂贵,前期需投入较大的成本。
发明内容
针对上述现有技术存在的问题,本发明提供一种基于机器学习融合模型的火灾热释放速率测量系统和方法,该测量系统和方法易于构建和实施,降低成本的同时还能够提高热释放速率预测的准确性和效率。
为了实现上述目的,本发明采用的技术方案是:一种基于机器学习融合模型的火灾热释放速率测量系统,包括数据获取模块、数据处理模块、数据构建模块、数据训练模块和数据预测模块,所述数据获取模块的输出端与数据处理模块输入端连接,所述数据处理模块输出端分别连接数据获取模块的输入端和数据构建模块输入端,所述数据构建模块的输出端连接数据训练模块的输入端,所述数据训练模块的输出端连接数据预测模块输入端;
所述数据获取模块用于获取FDS模拟数据和真实火灾数据,所述FDS模拟数据和真实火灾数据中均包含热电偶温度数据和热释放速率数据;
所述数据处理模块用于处理FDS模拟数据,筛选出热电偶组合;
所述数据构建模块用于基于真实火灾数据,即热电偶温度数据和热释放速率数据,构建样本数据集;
所述数据训练模块用于基于真实火灾数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对三个基模型进行训练,使用三个模型的预测值进行加权平均,得到热释放速率预测融合模型;
所述数据预测模块用于基于所述热释放速率预测融合模型对热释放速率进行预测。
一种基于机器学习融合模型的火灾热释放速率测量方法,包括如下步骤:
步骤一,在IS09705标准房间内构建FDS仿真模型,所述仿真模型包括试验房间和排烟系统,试验房间尺寸和排烟系统尺寸均按照IS09705标准构建,按照IS09705标准对仿真模型内各构件进行材料属性定义;
步骤二,将试验房间进行等体积切分,在每个切分单元体积中心布置热电偶,用于获取温度数据;
步骤三,获取FDS模拟数据,对所获得的FDS模拟数据进行特征筛选,特征筛选过程为:以试验房间内获取的热电偶数据为输入特征,以热释放速率为真实标签,构建数据集;通过构建随机森林模型,经过随机森林模型进行预测后获得的预测值,计算每个特征对应的重要度,再根据重要度进行筛选得出传感器组合;
步骤四,基于步骤三筛选得出的传感器组合布置IS09705标准房间真实火灾场地,获取真实火灾数据样本,过程为:将经步骤三得到的的传感器组合按照热电偶位置布置于IS09705标准房间内,进行真实火灾实验;使用获取到的热电偶温度数据、热释放速率数据构建真实火灾数据集,其中,所述真实火灾数据集包括第一训练集和第一测试集,并对所述的第一训练集进行缺省值处理;
步骤五,基于步骤四得到的真实火灾数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对其进行训练,并使用其预测值进行加权平均,得到热释放速率预测融合模型;
步骤六,基于步骤五得到的热释放速率预测融合模型对热释放速率进行预测。
进一步地,所述步骤三中的特征所对应的重要度的计算方法如下:
(1)记所述FDS模拟数据集的每个样本所包含的特征为特征Lx,x=1,2,…,X,根据Boostrap自助法从各样本的特征集中随机抽取N次形成子集,各子集记为Di,各子集的剩余样本即袋外样本集记为Bk,k=1,2,…,N,其包括n条样本;
(2)对于特征Lx,利用如下方程式,分别计算加入噪声干扰前后每个袋外样本集Bk对应的袋外误差,记未加入噪声干扰的袋外误差为记加入噪声干扰后的袋外误差为/>
其中,pt表示袋外样本集中第t个对应的实际值,表示未加入噪声干扰时,袋外样本集中第t个数据经过随机森林模型预测后的预测值,/>表示加入噪声干扰后,袋外样本集中第t个数据经过随机森林模型预测后得到的预测值;
(3)利用如下方程式,计算每个样本所包含的特征Lx对应的重要度;
(4)利用(2)至(3),计算出每个样本所包含的所有特征Lx分别对应的重要度后,将所有特征Lx按照重要度由大到小进行排序,保留重要度靠前的特征,完成特征筛选。
进一步地,所述步骤五中对第一机器学习子模型、第二机器学习子模型、第三机器学习子模型的训练采用五折交叉验证方法,所述五折交叉验证方法为将真实火灾数据集输入机器学习子模型,得到热释放速率预测值,具体步骤包括:
(1)将第一训练集分为5个第一子样本;
(2)选取任意一个第一子样本作为第一验证集,其余四个第一子样本作为第一训练样本;基于第一训练样本利用五折交叉验证训练机器学习子模型;
(3)调参确定机器学习子模型的最优参数,得到优化后的机器学习子模型,将优化后的机器学习子模型预测结果进行加权平均,得到最优的模型组合。
进一步地,所述步骤五中并对第一训练集进行缺省值处理的方法为:确定所述第一训练集的缺失值及所述缺失值邻域的非缺失值;根据所述非缺失值,采用k最近邻算法对所述缺失值进行插补。
进一步地,所述步骤五中第一机器学习子模型为线性回归模型,第二机器学习子模型为支持向量回归模型,第三机器学习子模型为轻量级分布式梯度提升框架。
本发明通过获取FDS模拟数据,基于FDS模拟样本数据集进行特征筛选,筛选出传感器组合,然后基于传感器组合进行真实火灾实验,获取真实火灾样本数据集;基于真实火灾样本数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对三个基模型进行训练,使用三个基模型的预测值加权平均,得到热释放速率预测融合模型;最后基于热释放速率预测融合模型对热释放速率进行预测。本发明实现了高效筛选与热释放速率相关的热电偶温度特征,降低了安装设备成本,降低了数据维度;通过使用三个基模型的预测值进行加权平均获取最优预测值得到热释放速率预测融合模型,提高了热释放速率预测模型的抗干扰能力,增强了模型的泛化能力。本测量系统和测量方法易于构建和实施,降低了成本的同时提高了热释放速率预测的准确性和效率。
附图说明
图1是本发明中测量方法的工作流程示意图;
图2是本发明实施例中热释放速率预测融合模型的构建过程示意图;
图3是本发明实施例中测量系统的硬件结构示意图;
图4是本发明实施例中测量系统的硬件结构的内部结构示意图。
图中,1、火源,2、热电偶,3、火灾试验房间,4、集烟罩,5、折流板,6、导流板。
具体实施方式
下面结合附图对本发明作进一步说明。
一种基于机器学习融合模型的火灾热释放速率测量系统,包括数据获取模块、数据处理模块、数据构建模块、数据训练模块和数据预测模块,所述数据获取模块的输出端与数据处理模块输入端连接,所述数据处理模块输出端分别连接数据获取模块的输入端和数据构建模块输入端,所述数据构建模块的输出端连接数据训练模块的输入端,所述数据训练模块的输出端连接数据预测模块输入端;
所述数据获取模块用于获取FDS模拟数据和真实火灾数据,所述FDS模拟数据和真实火灾数据中均包含热电偶温度数据和热释放速率数据;
所述数据处理模块用于处理FDS模拟数据,筛选出热电偶组合;
所述数据构建模块用于基于真实火灾数据,即热电偶温度数据和热释放速率数据,构建样本数据集;
所述数据训练模块用于基于真实火灾数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对三个基模型进行训练,使用三个模型的预测值进行加权平均,得到热释放速率预测融合模型;
所述数据预测模块用于基于所述热释放速率预测融合模型对热释放速率进行预测。
如图1和图2所示,一种基于机器学习融合模型的火灾热释放速率测量方法,包括如下步骤:
步骤一,在IS09705标准房间内构建FDS仿真模型,所述仿真模型包括试验房间和排烟系统,试验房间尺寸和排烟系统尺寸均按照IS09705标准构建,按照IS09705标准对仿真模型内各构件进行材料属性定义;
步骤二,将试验房间进行等体积切分,在每个切分单元体积中心布置热电偶,用于获取温度数据;
步骤三,获取FDS模拟数据,对所获得的FDS模拟数据进行特征筛选,特征筛选过程为:以试验房间内获取的热电偶数据为输入特征,以热释放速率为真实标签,构建数据集;通过构建随机森林模型,经过随机森林模型进行预测后获得的预测值,计算每个特征对应的重要度,再根据重要度进行筛选得出传感器组合;
步骤四,基于步骤三筛选得出的传感器组合布置IS09705标准房间真实火灾场地,获取真实火灾数据样本,过程为:将经步骤三得到的的传感器组合按照热电偶位置布置于IS09705标准房间内,进行真实火灾实验;使用获取到的热电偶温度数据、热释放速率数据构建真实火灾数据集,其中,所述真实火灾数据集包括第一训练集和第一测试集,并对所述的第一训练集进行缺省值处理;
步骤五,基于步骤四得到的真实火灾数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对其进行训练,并使用其预测值进行加权平均,得到热释放速率预测融合模型;
步骤六,基于步骤五得到的热释放速率预测融合模型对热释放速率进行预测。
进一步地,所述步骤三中的特征所对应的重要度的计算方法如下:
(1)记所述FDS模拟数据集的每个样本所包含的特征为特征Lx,x=1,2,…,X,根据Boostrap自助法从各样本的特征集中随机抽取N次形成子集,各子集记为Di,各子集的剩余样本即袋外样本集记为Bk,k=1,2,…,N,其包括n条样本;
(2)对于特征Lx,利用如下方程式,分别计算加入噪声干扰前后每个袋外样本集Bk对应的袋外误差,记未加入噪声干扰的袋外误差为记加入噪声干扰后的袋外误差为/>
其中,pt表示袋外样本集中第t个对应的实际值,表示未加入噪声干扰时,袋外样本集中第t个数据经过随机森林模型预测后的预测值,/>表示加入噪声干扰后,袋外样本集中第t个数据经过随机森林模型预测后得到的预测值;
(3)利用如下方程式,计算每个样本所包含的特征Lx对应的重要度;
(4)利用(2)至(3),计算出每个样本所包含的所有特征Lx分别对应的重要度后,将所有特征Lx按照重要度由大到小进行排序,保留重要度靠前的特征,完成特征筛选。
进一步地,所述步骤五中对第一机器学习子模型、第二机器学习子模型、第三机器学习子模型的训练采用五折交叉验证方法,所述五折交叉验证方法为将真实火灾数据集输入机器学习子模型,得到热释放速率预测值,具体步骤包括:
(1)将第一训练集分为5个第一子样本;
(2)选取任意一个第一子样本作为第一验证集,其余四个第一子样本作为第一训练样本;基于第一训练样本利用五折交叉验证训练机器学习子模型;
(3)调参确定三个机器学习子模型的最优参数,得到优化后的三个机器学习子模型,将优化后的三个机器学习子模型预测结果进行加权平均,得到最优的模型组合。
进一步地,所述步骤五中并对第一训练集进行缺省值处理的方法为:确定所述第一训练集的缺失值及所述缺失值邻域的非缺失值;根据所述非缺失值,采用k最近邻算法对所述缺失值进行插补。
进一步地,所述步骤五中第一机器学习子模型为线性回归模型,第二机器学习子模型为支持向量回归模型,第三机器学习子模型为轻量级分布式梯度提升框架。
实施例:
一、FDS所建模型参考ISO9705标准房间建立,房间模型尺寸为长3.6m,宽2.4m,高2.4m,按比例具体剖分为72×48×48个网格;初始环境温度定为20℃,如图3所示,燃烧器设置的火源1在房间角落,另将房间进行等体积划分为18×12×12个单元,每个单元体积中心布置热电偶,热电偶矩阵共计2592个热电偶2,模拟共生成2592个热电偶温度数据和火源的热释放速率数据;
FDS的数值计算采用适合低速流动和热驱动的Navier-Stokes方程,运用大涡流流体力学模型处理紊态流动,其中流体的能量、动量和质量控制偏微分方程如下所示:
能量守恒方程:
动量守恒方程:
质量守恒方程:
其中,
ρ为气体密度,h为显焓,u为速度矢量,p为压力,t为时间,q”’为单位体积的热释放速率,gn为单位质量的流体所受到的重力,f为外部矢量,τij指牛顿流体黏性应力张量;欧拉公式中,将视为一个算子D;Φ是对时间t的耗散函数,Y为流体表面微元做功的功率;
二、基于FDS模拟数据集,对热电偶温度数据进行特征筛选,得到热电偶组合,具体步骤为:
(1)按照经验值初步设定随机森林特征筛选模型参数的取值范围,参数具体包括最大迭代次数n_estimators、决策树最大深度max_depth、分裂内部节点所需最小样本数min_samples_split、叶子节点最小样本数min_samples_leaf;
(2)采用随机搜索交叉验证法对上述参数进行搜索,采用3折交叉验证进行100次参数组合得到最优参数,并计算各个最优参数对应的评价指标,如给定一组参数,采用Bootstrap自助法从FDS模拟数据集中随机抽取样本,构成相应的训练集和测试集,通过训练集构建随机森林模型,利用随机森林模型对测试集进行预测并计算模型精度评价指标,评价指标包括均方根误差(RMSE)和拟合程度(R2),其中均方根误差反映预测值和实际值之间的误差,其值越大,表明误差越大,模型的预测性能越差;拟合程度则反映了模型因变量的变异中有多少百分比可由自变量来解释,拟合程度越大,表示模型拟合度越好;
利用随机森林模型对测试集进行预测并计算模型精度评价指标具体步骤为:
(201)采用Booststrap自助法从原始样本中随机、有放回地抽取N次,构成N个独立的训练集{D1,D2,…,DN},每个训练集可生成一颗决策树,则共有N棵决策树{T1,T2,…,TN};
(202)每棵决策树从M个初始特征集合中随机抽取m个特征作为每个节点的候选分裂特征集,再从候选分裂特征集中选择最优特征进行分裂;
(203)重复(202),直至N棵决策树均能够准确分类训练数据,或所有特征属性均已被使用过;
(204)将N棵决策树{T1,T2,…,TN}进行集成,得到随机森林模型;
(3)利用构建好的随机森林模型对FDS模拟数据集的特征参数进行特征筛选,依据筛选出的特征即热电偶的组合:{F1(x1,y1,z1),F2(x2,y2,z2),…,FN(xN,yN,zN)}作为后续真实火灾实验热电偶布置位置,具体为对FDS模拟数据集进行预处理,基于预处理后的FDS模拟数据集对应的实际值和利用随机森林模型进行预测后获得的预测值,计算每个特征对应的重要度,其特征重要度的计算方法包括以下步骤:
(301)记FDS模拟数据集的每个样本所包含的特征为Lx,x=1,2,…,X,即分别对应2592个热电偶,根据Boostrap自助法从FDS模拟数据集中随机抽取N次,采用随机有放回的方式进行抽取,每次抽取75%的数据以组成子集,每个子集记为Di,构成N个训练用子集,则每个子集对应的剩余样本集即袋外样本集记为Bk,i,k=1,2,…,N;
(302)对于特征Lx,利用如下方程式,计算加入噪声干扰前后每个袋外样本集Bk对应的袋外误差,记未加入噪声干扰的袋外误差为加入噪声干扰后的袋外误差为
其中,pt表示袋外样本集中第t个对应的实际值,表示未加入噪声干扰时,袋外样本集中第t个数据经过随机森林模型预测后的预测值,/>表示加入噪声干扰后,袋外样本集中第t个数据经过随机森林模型预测后得到的预测值;噪声可以通过随机改变样本在特征Lx处的值实现,n表示每个袋外样本集包括的数据个数;
(303)利用如下方程式,计算特征Lx对应的重要度:
(304)重复(302)至(303),计算Lx对应的重要度;
(305)依据重要度进行特征筛选即将所有特征Lx按照重要度由大到小排序,然后选择重要度排序靠前的热电偶组合即热电偶Fi,位置(xi,yi,zi),数据集为{F1(x1,y1,z1),F2(x2,y2,z2),…,FN(xN,yN,zN)},作为后续的热电偶布置方案;
三、基于得到的热电偶组合布置真实火灾实验场地,获取热电偶温度数据和热释放速率数据,构建真实火灾数据集。采用ISO9705标准房间热释放速率测试系统,火源位置为房间角落,位置不变,模拟火灾场景的火源燃料选用正庚烷,通过改变油盘尺寸与正庚烷质量来控制其火灾强度:不同油盘尺寸的火灾场景,以正庚烷为燃料,燃料质量均为10kg,分别采用40cm×40cm、50cm×50cm、60cm×60cm、70cm×70cm、80cm×80cm的油盘来模拟不同火源功率的火灾场景;不同燃料质量的火灾场景,选用大小适宜的60cm×60cm的油盘,分别燃烧10kg、15kg、20kg不同质量的正庚烷;
风速设置为1m3/s,共设置15种火灾工况获取真实火灾数据,试验过程中对me和X(O2)进行实时测试,并根据公式计算得出试验过程各时刻的热释放速率Q(t);式中,me为测试得出的试验过程中各时刻所产生烟气的质量流量且单位为kg/s,XO(O2)为测试得出的正庚烷燃烧前空气中氧气的摩尔分数,X(O2)为测试得出的试验过程中各时刻空气中氧气的摩尔分数,上述空气中氧气的摩尔分数也称为空气中氧气的物质的量分数,即空气中氧气的物质的量与空气中所有组分的物质的量之和之比;
如图4所示,采用IS09705标准房间热释放速率测试系统进行热释放速率测量试验时,所采用的IS09705标准房间热释放速率测试系统主要由IS09705标准火灾试验房间3和烟气收集装置(也称耗氧量热器)两大部分组成,其中IS09705房间内布置正庚烷油盘火作为火源1所采用的的烟气收集装置主要包括集烟罩4以及折流板5和导流板6,集烟罩4放在IS09705标准火灾试验房间的门口上方,IS09705标准火灾试验房间3内火源1所产生的烟气经折流板5和导流板6充分混合后,进入烟气分析系统,以测量烟气的氧含量,并根据公式计算得到火灾热释放速率(HRR)的时间序列Q(t),热电偶温度数据的时间序列T(t);构建真实火灾数据样本,每个样本包含热电偶组的温度数据{T1,T2,…,TN}和热释放速率数据HRR。将真实火灾数据集分为第一训练样本,第二测试样本,在基于第一训练样本,利用五折交叉验证训练机器学习模型之前,还包括对第一训练样本进行缺省值处理。
其中,缺省值处理为确定第一训练样本中的缺失值及缺失值邻域的非缺失值:根据非缺失值,采用k最近邻算法对缺失值进行插补,将第一训练样本转化为适用于机器学习模型的数据集格式。
四、基于所述真实火灾样本数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对三个基模型进行训练,使用三个基模型的预测值进行加权平均,得到热释放速率预测融合模型;
本实施例中,第一机器学习子模型为线性回归模型(Linear Regression,LR),第二机器学习子模型为支持向量回归模型(Support Vector Regression,SVR),第三机器学习子模型为轻量级分布式梯度提升框架(LightGBM Gradient Boosting,LightGBM);
关于线性回归模型具体如下:
(1)线性回归模型的构建:T1,T2,…,TN表示热电偶温度数据,HRR表示火源的热释放速率,h表示将输入变量映射到输出变量HRR的函数,对于本线性回归模型的公式如下:
HRRθ(T1,T2,…TN)=θ0+θ1T1+θ2T2+…+θNTN;
即目前需求得{θ0,θ1,…,θN}的解,选取的参数使得函数值尽可能接近HRR。这里选取最小化误差平方和方法。误差是指预测HRR值和真实HRR值之间的差值,定义该线性回归模型的损失函数为:
选择适当的参数最小化min,即可实现拟合求解过程;
调参过程:采用小批量随机梯度下降法,随机选取{θ0,θ1,…,θN}的初始值;接下来对参数进行多次迭代,使每次迭代都可能降低损失函数的值。在每次迭代中,先随机均匀采样一个由固定数目训练数据样本所组成的小批量Β,然后求小批量中数据样本的平均损失模型参数的导数(梯度),最后用此结果与预先设定的一个正数的乘积作为模型参数在本次迭代的减小量,人为设定超参数的数值:每个小批量中的样本个数(批量大小,batchsize):|Β|;学习率(learning rate):η;
模型的每个参数将做如下迭代:先迭代{θ1,θ2,…,θi,…,θN},后迭代θ0:
最后采用五折交叉验证进行评估。
关于支持向量回归模型具体如下:
支持向量机回归为找到一个决策边界或决策超平面:
f(T1,T2,…TN)=wT(T1,T2,…TN)+b;使得模型对样本(T1,T2,…TN)的预测值f(T1,T2,…TN)与标签HRR之间的距离尽可能小;
偏差ε表示SVR对样本(T1,T2,…TN)的预测值f(T1,T2,…TN)与标签HRR之间的偏差的容忍度,当两者之间的偏差小于ε时,损失为0;当两者之间的偏差不小于ε时,损失不为0,这个损失可以由如下的公式表达出来:
l∈(f(xi)-yi)=0,|f(xi)-yi|≤ε;
l∈(f(xi)-yi)=|f(xi)-yi|-ε,|f(xi)-yi|≤ε;
调参过程:支持向量回归模型选择高斯核函数,同时指定核函数的参数gamma,基于随机搜索的方法寻求最优参数;选择惩罚系数C和容忍范围ε的范围,并针对选择的C和ε的范围生成不同的参数组合;针对不同的参数组合,采用五折交叉验证的方式进行评估;选择平均交叉验证误差最小的参数组合作为最终模型的参数。
关于轻量级分布式梯度提升框架具体如下:轻量级分布式梯度提升框架是一个微软开源实现GBDT的框架,相比传统的GBDT算法,该框架处理速度更快,准确率更高,更有利于处理海量数据,其主要改进包括直方图算法和带深度限制的叶子生长(leaf-wise)策略。直方图算法将连续数据划分为K个整数,并构造宽度为K的直方图,遍历时将离散化的值作为索引在直方图中累积,进而搜索出最优的决策树分割点;而带深度限制的leaf-wise策略是指在每次分裂时,找到最大增益的叶子进行分裂并循环下去。同时,通过树的深度以及叶子数限制,减小模型的复杂度,防止出现过拟合;
调参过程:设定学习率(learning_rate)为0.01,将迭代的次数即残差树的数据设置为较大的数值,然后再cv结果中查看最优的迭代次数。按照经验值初步设定LightGBM模型参数的取值范围,参数具体决策树的叶子数num_leaves、箱的最大特征数max_bin、每棵决策树训练之前选择非重复采样训练的比例bagging_fraction、bagging的频率bagging_freq、随机数种子bagging_seed和LightGBM每次迭代时选取特征的比例feature_fraction。
采用随机搜索交叉验法对上述参数进行搜索,采用五折交叉验证进行300次参数组合得到最优参数,并计算各个参数组合对应的评价指标,选择最优参数组合。
五、使用三个学习子模型的预测值进行加权平均,得到热释放速率预测融合模型,具体为:
(1)分别训练线性回归模型、支持向量机回归模型和LightGBM模型,得到每个模型的预测结果;
(2)对每个模型的预测结果进行加权平均,得到最终的融合模型预测结果;
(3)选择合适的权重值,使得每个基础模型的预测结果在融合后的结果中占据适当的比例;
(4)对融合模型进行评估,并根据评估结果对权重值进行调整,直至获得最佳的融合模型。
六、基于得到的热释放速率预测融合模型对热释放速率进行预测:
选用真实火灾IS09705大型量热仪测量所得热释放速率对热释放速率预测结果进行比较验证,采用预测结果和测量结果之间的拟合程度R2与均方根误差RMSE作为评价指标。如表1所示,实验结果表明,热释放速率预测融合模型充分利用了融合模型能够快速处理高纬度数据和拟合复杂关系的优势,大大提升了基于热电偶温度数据预测热释放速率的准确性。
表1模型评价指标表
/>
Claims (6)
1.一种基于机器学习融合模型的火灾热释放速率测量系统,其特征在于,包括数据获取模块、数据处理模块、数据构建模块、数据训练模块和数据预测模块,所述数据获取模块的输出端与数据处理模块输入端连接,所述数据处理模块输出端分别连接数据获取模块的输入端和数据构建模块输入端,所述数据构建模块的输出端连接数据训练模块的输入端,所述数据训练模块的输出端连接数据预测模块输入端;
所述数据获取模块用于获取FDS模拟数据和真实火灾数据,所述FDS模拟数据和真实火灾数据中均包含热电偶温度数据和热释放速率数据;
所述数据处理模块用于处理FDS模拟数据,筛选出热电偶组合,所述的筛选步骤为:
(1)按照经验值初步设定随机森林特征筛选模型参数的取值范围,参数具体包括最大迭代次数n_estimators、决策树最大深度max_depth、分裂内部节点所需最小样本数min_samples_split、叶子节点最小样本数min_samples_leaf;
(2)采用Bootstrap自助法从FDS模拟数据集中随机抽取样本,构成相应的训练集和测试集,通过训练集构建随机森林模型,利用随机森林模型对测试集进行预测并计算模型精度评价指标;
(3)利用构建好的随机森林模型对FDS模拟数据集的特征参数进行特征筛选,依据筛选出的特征即热电偶的组合作为后续真实火灾实验热电偶的布置位置;
所述数据构建模块用于基于真实火灾数据,即热电偶温度数据和热释放速率数据,构建样本数据集;
所述数据训练模块用于基于真实火灾数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对三个基模型进行训练,使用三个模型的预测值进行加权平均,得到热释放速率预测融合模型;
所述数据预测模块用于基于所述热释放速率预测融合模型对热释放速率进行预测。
2.一种基于机器学习融合模型的火灾热释放速率测量方法,其特征在于,包括如下步骤:
步骤一,在ISO9705标准房间内构建FDS仿真模型,所述仿真模型包括试验房间和排烟系统,试验房间尺寸和排烟系统尺寸均按照ISO9705标准构建,按照ISO9705标准对仿真模型内各构件进行材料属性定义;
步骤二,将试验房间进行等体积切分,在每个切分单元体积中心布置热电偶,用于获取温度数据;
步骤三,获取FDS模拟数据,对所获得的FDS模拟数据进行特征筛选,特征筛选过程为:以试验房间内获取的热电偶数据为输入特征,以热释放速率为真实标签,构建数据集;通过构建随机森林模型,经过随机森林模型进行预测后获得的预测值,计算每个特征对应的重要度,再根据重要度进行筛选得出传感器组合;
步骤四,基于步骤三筛选得出的传感器组合布置ISO9705标准房间真实火灾场地,获取真实火灾数据样本,过程为:将经步骤三得到的传感器组合按照热电偶位置布置于ISO9705标准房间内,进行真实火灾实验;使用获取到的热电偶温度数据、热释放速率数据构建真实火灾数据集,其中,所述真实火灾数据集包括第一训练集和第一测试集,并对所述的第一训练集进行缺省值处理;
步骤五,基于步骤四得到的真实火灾数据集,将第一机器学习子模型、第二机器学习子模型、第三机器学习子模型作为基模型,分别对其进行训练,并使用其预测值进行加权平均,得到热释放速率预测融合模型;
步骤六,基于步骤五得到的热释放速率预测融合模型对热释放速率进行预测。
3.根据权利要求2所述的一种基于机器学习融合模型的火灾热释放速率测量方法,其特征在于,所述步骤三中的特征所对应的重要度的计算方法如下:
(1)记所述FDS模拟数据集的每个样本所包含的特征为特征Lx,x=1,2,…,X,根据Boostrap自助法从各样本的特征集中随机抽取N次形成子集,各子集记为Di,各子集的剩余样本即袋外样本集记为Bk,k=1,2,…,N,其包括n条样本;
(2)对于特征Lx,利用如下方程式,分别计算加入噪声干扰前后每个袋外样本集Bk对应的袋外误差,记未加入噪声干扰的袋外误差为,记加入噪声干扰后的袋外误差为:
其中,/>表示袋外样本集中第t个对应的实际值,/>表示未加入噪声干扰时,袋外样本集中第t个数据经过随机森林模型预测后的预测值,/>表示加入噪声干扰后,袋外样本集中第t个数据经过随机森林模型预测后得到的预测值;
(3)利用如下方程式,计算每个样本所包含的特征Lx对应的重要度:
(4)利用(2)至(3),计算出每个样本所包含的所有特征Lx分别对应的重要度后,将所有特征Lx按照重要度由大到小进行排序,保留重要度靠前的特征,完成特征筛选。
4.根据权利要求2所述的一种基于机器学习融合模型的火灾热释放速率测量方法,其特征在于,所述步骤五中对第一机器学习子模型、第二机器学习子模型、第三机器学习子模型的训练采用五折交叉验证方法,所述五折交叉验证方法为将真实火灾数据集输入机器学习子模型,得到热释放速率预测值,具体步骤包括:
(1)将第一训练集分为5个第一子样本;
(2)选取任意一个第一子样本作为第一验证集,其余四个第一子样本作为第一训练样本;基于第一训练样本利用五折交叉验证训练机器学习子模型;
(3)调参确定机器学习子模型的最优参数,得到优化后的机器学习子模型,将优化后的机器学习子模型预测结果进行加权平均,得到最优的模型组合。
5.根据权利要求2所述的一种基于机器学习融合模型的火灾热释放速率测量方法,其特征在于,所述步骤五中并对第一训练集进行缺省值处理的方法为:确定所述第一训练集的缺失值及所述缺失值邻域的非缺失值;根据所述非缺失值,采用k最近邻算法对所述缺失值进行插补。
6.根据权利要求2所述的一种基于机器学习融合模型的火灾热释放速率测量方法,其特征在于,所述步骤五中第一机器学习子模型为线性回归模型,第二机器学习子模型为支持向量回归模型,第三机器学习子模型为轻量级分布式梯度提升框架。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310420242.5A CN116451582B (zh) | 2023-04-19 | 2023-04-19 | 基于机器学习融合模型的火灾热释放速率测量系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310420242.5A CN116451582B (zh) | 2023-04-19 | 2023-04-19 | 基于机器学习融合模型的火灾热释放速率测量系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116451582A CN116451582A (zh) | 2023-07-18 |
CN116451582B true CN116451582B (zh) | 2023-10-17 |
Family
ID=87121578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310420242.5A Active CN116451582B (zh) | 2023-04-19 | 2023-04-19 | 基于机器学习融合模型的火灾热释放速率测量系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116451582B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536665A (zh) * | 2021-06-18 | 2021-10-22 | 云南省交通规划设计研究院有限公司 | 基于特征工程和lstm的路表温度短临预测方法及系统 |
CN113570165A (zh) * | 2021-09-03 | 2021-10-29 | 中国矿业大学 | 基于粒子群算法优化的煤储层渗透率智能预测方法 |
CN114021501A (zh) * | 2021-11-09 | 2022-02-08 | 华东理工大学 | 一种火灾温度场重构方法、系统、计算机设备、介质及终端 |
CN114067545A (zh) * | 2021-11-15 | 2022-02-18 | 浙江时空智子大数据有限公司 | 一种基于遥感大数据的森林火灾监测方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119808A (zh) * | 2018-02-06 | 2019-08-13 | 华为技术有限公司 | 一种基于机器学习的数据处理方法以及相关设备 |
US11966670B2 (en) * | 2018-09-06 | 2024-04-23 | Terrafuse, Inc. | Method and system for predicting wildfire hazard and spread at multiple time scales |
-
2023
- 2023-04-19 CN CN202310420242.5A patent/CN116451582B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536665A (zh) * | 2021-06-18 | 2021-10-22 | 云南省交通规划设计研究院有限公司 | 基于特征工程和lstm的路表温度短临预测方法及系统 |
CN113570165A (zh) * | 2021-09-03 | 2021-10-29 | 中国矿业大学 | 基于粒子群算法优化的煤储层渗透率智能预测方法 |
CN114021501A (zh) * | 2021-11-09 | 2022-02-08 | 华东理工大学 | 一种火灾温度场重构方法、系统、计算机设备、介质及终端 |
CN114067545A (zh) * | 2021-11-15 | 2022-02-18 | 浙江时空智子大数据有限公司 | 一种基于遥感大数据的森林火灾监测方法及系统 |
Non-Patent Citations (2)
Title |
---|
基于可见光图像和机器学习的温度测量方法研究;王明;《中国优秀硕士论文电子期刊网》;全文 * |
基于机器视觉和灰色模型的矿井外因火灾辨识与定位方法;李光宇 等;《矿业安全与环保》;第50卷(第2期);第82-87页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116451582A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112446591B (zh) | 一种用于学生综合能力评价的零样本评价方法 | |
CN108875118B (zh) | 一种高炉铁水硅含量预测模型准确度评价方法和设备 | |
CN107958267B (zh) | 一种基于光谱线性表示的油品性质预测方法 | |
CN109377440B (zh) | 一种基于多任务集成学习器的pm2.5和o3浓度协同预测方法 | |
CN112948932A (zh) | 一种基于TSP预报数据与XGBoost算法的围岩等级预测方法 | |
CN107704883A (zh) | 一种菱镁矿矿石的品级的分类方法及系统 | |
CN113011660A (zh) | 空气质量预测方法、系统及存储介质 | |
CN112884012A (zh) | 基于支持向量机原理的建筑能耗预测方法 | |
CN112614021A (zh) | 一种基于已建隧道信息智能识别的隧道围岩地质信息预测方法 | |
CN115270239A (zh) | 基于动力特性和智能算法响应面法的桥梁可靠性预测方法 | |
CN113281229B (zh) | 一种基于小样本下多模型自适应大气pm2.5浓度预测方法 | |
CN116451582B (zh) | 基于机器学习融合模型的火灾热释放速率测量系统和方法 | |
CN109521001A (zh) | 一种基于PSO和ε-SVR的飞灰含碳量测量方法 | |
CN117370766A (zh) | 一种基于深度学习的卫星任务规划方案评估方法 | |
CN112163632A (zh) | 基于蝙蝠算法的半监督极限学习机在工业检测中的应用 | |
CN111126827A (zh) | 一种基于bp人工神经网络的投入产出核算模型构建方法 | |
CN107992454B (zh) | 一种基于在线顺序回归的空气质量等级预测方法 | |
CN114818493A (zh) | 一种隧道岩体完整程度定量评价的方法 | |
CN115062551A (zh) | 一种基于时序神经网络的湿物理过程参数化方法 | |
CN113591363A (zh) | 一种基于多频超声检测的变压器油介质损耗回归预测方法 | |
CN115907178B (zh) | 一种净生态系统co2交换量的预测方法 | |
CN111062118A (zh) | 一种基于神经网络预测分层的多层软测量建模系统及方法 | |
Murukonda et al. | Prediction of air quality index using supervised machine learning | |
CN117805024B (zh) | 一种酥梨糖精度检测方法、装置、云端设备及计算机装置 | |
Ma et al. | Modeling method of small sample data and optimization in ultrasonic extraction process of botanicals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |