CN117172379A - 一种基于趋势特征值和改进随机森林的煤矿灾害预警方法 - Google Patents

一种基于趋势特征值和改进随机森林的煤矿灾害预警方法 Download PDF

Info

Publication number
CN117172379A
CN117172379A CN202311143714.3A CN202311143714A CN117172379A CN 117172379 A CN117172379 A CN 117172379A CN 202311143714 A CN202311143714 A CN 202311143714A CN 117172379 A CN117172379 A CN 117172379A
Authority
CN
China
Prior art keywords
data
trend
algorithm
value
queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311143714.3A
Other languages
English (en)
Inventor
张华乾
于庆
郭清华
孙世岭
伍玉山
苟怡
路萍
张书林
但强
王博文
蒋洪庆
周德胜
张远征
赵庆川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Coal Research Institute CCRI
CCTEG Chongqing Research Institute Co Ltd
Original Assignee
China Coal Research Institute CCRI
CCTEG Chongqing Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Coal Research Institute CCRI, CCTEG Chongqing Research Institute Co Ltd filed Critical China Coal Research Institute CCRI
Priority to CN202311143714.3A priority Critical patent/CN117172379A/zh
Publication of CN117172379A publication Critical patent/CN117172379A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Alarm Systems (AREA)

Abstract

本发明涉及一种基于趋势特征值和改进随机森林的煤矿灾害预警方法,属于煤矿灾害预测技术领域。该方法包括:在预测数据方面,应用AHP‑RF算法得到数据预测值;在判断数据整体变化趋势方面,应用Savitzky‑Golay算法对原始数据进行平滑处理,设置采样频率,将平滑后的数据置于队列中,再通过AHP‑RF算法得到一项整体趋势的预测数据置于队尾,根据每一项数据的采样时间计算各项数据与标定数据的斜率作为趋势特征值,以此来表现传感器监测数据的变化趋势并给出相应的灾害预警等级。本发明能够从传感器监测数据整体变化趋势和预测数据两方面识别煤矿灾害,从而提高煤矿灾害预警的准确度。

Description

一种基于趋势特征值和改进随机森林的煤矿灾害预警方法
技术领域
本发明属于煤矿灾害预测技术领域,涉及一种基于趋势特征值和改进随机森林的煤矿灾害预警方法。
背景技术
由进风巷、采煤工作面和回风巷组成的区域是煤炭生产的第一现场,由于该区域具有温度高、气体环境复杂等特点成为了煤矿事故的频发区域,严重威胁着整个矿区的安全管理工作。尽管矿井通风系统能够在煤矿作业时保证工作环境温度和气体浓度的稳定,在实际作业时依然存在因回风隅角瓦斯堆积产生瓦斯爆炸、煤炭自燃等工矿事故。为了保证煤矿工人的生命安全,必要对该区域各类传感器监测数据指标进行有效预测。
随着人工智能和信息化技术的不断发展,在煤炭领域中气体浓度的预测方法主要分为标志气体分析法或随机森林算法。
1、标志气体分析法,根据煤炭氧化过程中产生的气体与空气组分的区别对煤矿灾害进行预警,其预测指标一般为一氧化碳、甲烷、稀烷比等。在实际应用中,该方法存在以下问题:
(1)该方法无法直接应用煤炭温度指标对煤矿灾害进行预测;
(2)该方法不能识别灾害的发展趋势。
2、随机森林算法,是一种集成类算法,它的运算单元是决策树。其原理为通过归纳学习的手段应用杂乱无序的已知数据得到每棵树的决策值,对这些值取平均得到最终的预测数据。在现实应用中,该方法存在以下问题:
(1)该方法不能分析传感器监测数据指标的整体变化趋势。
(2)传感器监测数据中含有各类灾害的特征信息,预测时对决策值取平均会减小对灾害的辨识度。
因此,亟需一种能够准确且及时预测煤矿灾害的方法。
发明内容
有鉴于此,本发明的目的在于提供一种基于趋势特征值和改进随机森林的煤矿灾害预警方法,从传感器监测数据整体变化趋势和预测数据两个方面识别煤矿灾害,从而提高煤矿灾害预警的准确度。
为达到上述目的,本发明提供如下技术方案:
一种基于趋势特征值和改进随机森林的煤矿灾害预警方法,包括:根据预测数据和判断数据整体变化趋势两方面来预测灾害预警等级,当其中任一方面的预测结果达到预警条件,则进行预警;
在预测数据方面,应用AHP-RF算法得到传感器监测数据预测值,即是将决策单元分成五个区间,应用层次分析法得到决策值分布的权重矩阵,由各区间权重系数改进传统随机森林算法中的投票机制,通过权重加权平均得到最终的预测值;
在判断数据整体变化趋势方面,应用Savitzky-Golay算法对原始传感器监测数据进行平滑处理,设置采样频率为f1,将n-1组数据按时间顺序传至特征值队列中,再通过AHP-RF算法得到一项整体趋势的预测数据置于队尾,如果队列的数据满足单一单调性,以时间为横轴,计算各项数据与预测数据的斜率作为趋势特征值,以此来表现传感器监测数据的变化趋势并给出相应的灾害预警等级;其中,AHP-RF算法为基于层次分析法改进的随机森林算法。
进一步,在预测数据方面,应用AHP-RF算法得到传感器监测数据预测值,具体包括:将各传感器监测数据按特定监测点进行分类,根据每个监测点内数据之间的关系拟合成多元复合函数H(x;y)的形式,其中x表示判断灾害预报警等级的特征因素,y表示影响该特征因素的各项监测指标;将复合函数值送入AHP-RF算法进行预测,该算法是在传统的随机森林算法上对投票机制进行改进,具体为:随机森林的预测单元为CART决策树,设训练集样本总量为H,分割比例为β,随机森林的树木数量为R;
CART决策树用条件Gini系数选择最优特征;设决策树样本为D,按照特征A进行分类,有
其中,D1、D2分别为按照特征A分类后的两类样本。生成CART决策树后,使用均方误差σ作为模型误差的度量指标,即
选择最贴近均方误差σ的分类值作为预测值λ,将每个CART决策树的预测值从大到小排列,根据最大预测差值max{Δλ}将预测数据组等分为五个部分,即R1~R5。统计每个分位区间预测数据量占总数据量的比例,以各个区间的相对比例作为矩阵的标度χij,即
其中,εi表示第i个分位区间预测数据量占总数据量的比例。根据每个标度的方根权重系数计算每个区间的权重,即
其中,为方根法权重系数。计算出权重后,对各区域的数据进行加权平均运算得到预测数值,即
其中,θ为预测数据。对该数据进行灾害临界值判定,设μi为各项传感器监测数据的临界值,其判定公式如下:
其中,η为预测数据相对于临界值的位置。
进一步,所述判断灾害预报警等级的特征因素包括进风巷的氧气浓度数据,受风速数据和风向数据影响;回风隅角的甲烷浓度数据和一氧化碳浓度数据;回风巷的温度数据、甲烷浓度数据和一氧化碳浓度数据,其中,甲烷浓度数据和一氧化碳浓度数据受温度数据和风速数据影响。
进一步,在判断数据整体变化趋势方面,计算趋势特征值的具体方法为:设持续时间限度为T,队列填满的次数为τ,标定数据为ζ,ap和aq为采集的第p项数据和第q项数据,其中q<p。在队尾的M项数据中,若ap与aq近似,即该两项数据的差小于设定的限度,释放aq~ap-1并将ap右移至aq所在位置;若记录数据期间初次填满了队列,即τ=1,则将预测数据a0的值传给ζ,计算ζ与队列中每项数据的斜率作为趋势特征值。
进一步,在判断数据整体变化趋势方面,如果趋势特征值满足以下两种条件的任意一种,则触发预警信号:
1)超过给定的预警限度;
2)趋势特征值持续时间超过了时间限度T,即监测数据整体变化趋势在满足单一单调性的情况下持续了T时间。
考虑到通过人工干预改善矿井工作环境的情况,如果队列中有k项以上数据与a1近似,则清空ζ并将计时时间T和队列填满次数τ置0。
本发明的有益效果在于:
1)本发明引入Savitzky-Golay滤波法和趋势特征值对整体传感器监测数据进行分析,弥补了标志气体分析法和随机森林算法预测数据过程中忽略传感器数据整体变化趋势的缺点,在一定程度上能够更早、更精准的预测灾害发生。
2)相较传统随机森林算法,本发明方法引入了层次分析法(AHP),根据CART决策树预测数据在不同区间的比例对投票机制进行改进,能够有效提高预测传感器数据的准确性,从而提高判断灾害等级的准确度。
3)相较指标气体分析法,该方法应用的数据量大,能够在一定程度上有效克服低频噪声对数据的干扰,具有更好的系统稳定性。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明采煤环境预警方法架构图;
图2为AHP-RF算法原理图;
图3为趋势特征值计算原理图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图3,本发明提供一种基于趋势特征值和改进随机森林算法的煤矿灾害预警方法,该方法能够从传感器监测数据整体监测趋势和预测数据识别煤矿灾害。考虑到采煤工作区域的各种灾害与气体浓度之间的关系,对灾害进行分类,根据灾害预警等级进行预报警。
在判断数据整体变化趋势方面,应用Savitzky-Golay算法对传感器监测数据进行平滑运算,该方法能够有效保留传感器数据曲线的变化趋势。将平滑后的数据置于队列中,队列的先入先出原则能够实现数据的动态更新,根据每一项数据的采样时间计算各项数据与标定数据的斜率作为趋势特征值,以此来表现传感器监测数据的变化趋势并给出相应的灾害预警等级。
在预测数据方面,应用基于层次分析法(AHP)改进的随机森林算法(AHP-RF算法)得到传感器监测数据预测值,该算法相较于传统的随机森林算法能够有效保留数据中各类灾害的特征信息,其原理为将决策单元分成五个区间,应用AHP层次分析法得到决策值分布的权重矩阵,由各区间权重系数改进传统随机森林算法中的投票机制,通过权重加权平均得到最终的预测值,该算法能有效提升识别灾害类型和判断灾害等级的合理性。
采煤环境预警方法架构图参照图1。根据《煤矿安全规程》和往年发生的事故原因分析,进风巷、回风隅角、回风巷的传感器监测参数尤其重要,进风巷采集风速数据、风向数据和氧气浓度数据;回风隅角采集甲烷浓度数据和一氧化碳浓度数据;回风巷采集温度数据、甲烷数据和风速数据。根据监测标准,针对每项数据设定不同的报警限度,从预测数据方面和判断数据整体变化趋势两方面进行分析:
在预测数据方面,将各传感器采集数据按特定监测点进行分类,根据每个监测点内数据之间的关系拟合成多元复合函数H(x;y)的形式,其中x表示判断灾害预报警等级的特征因素,y表示影响该特征因素的各项监测指标,该类函数能够综合考虑各监测点的影响因素,从而提升后续数据预测的精准度。将复合函数值送入基于层次分析法(AHP)改进的随机森林算法(AHP-RF)进行预测,该算法在传统的随机森林算法上对投票机制进行了改进。随机森林的预测单元为CART决策树,设训练集样本总量为H,分割比例为β,随机森林的树木数量为R,AHP-RF算法的原理图参照图2。
CART决策树用条件Gini系数选择最优特征。设决策树样本为D,按照特征A进行分类,有
生成CART决策树后,使用均方误差σ作为模型误差的度量指标,即
选择最贴近均方误差σ的分类值作为预测值λ,将每个CART决策树的预测值从大到小排列,根据最大预测差值max{Δλ}将预测数据组等分为五个部分,即R1~R5。统计每个分位区间预测数据量占总数据量的比例,以各个区间的相对比例作为矩阵的标度,即
其中,εi表示第i个分位区间预测数据量占总数据量的比例。根据每个标度的方根权重系数计算每个区间的权重,即
其中,为方根法权重系数。计算出权重后,对各区域的数据进行加权平均运算得到预测数值,即
其中,θ为预测数据。对该数据进行灾害临界值判定,设μi为各项数据的判定标准值,其判定公式如下:
以甲烷、一氧化碳和温度预测值为例,将预警分为五个等级,对应于η的触发区间分别为:
等级1:η在0.8附近波动,对应于预测数据较于临界值在80%附近波动。
等级2:η在0.85附近波动,对应于预测数据较于临界值在85%附近波动。
等级3:η在0.9附近波动,对应于预测数据较于临界值在90%附近波动,触发预警。
等级4:η在0.95附近波动,对应于预测数据相较于临界值在95%附近波动。
等级5:η小于0,对应于预测数据超过临界值,触发报警。
其中,可通过设置警报声音的大小和频率区分预警和报警。
在判断数据整体变化趋势方面,应用Savitzky-Golay算法对原始数据进行平滑处理,设置采样频率为f1,将n-1组数据按时间顺序传至特征值队列中,再通过AHP-RF算法得到一项整体趋势的预测数据置于队尾,如果队列的数据满足单一单调性,以时间为横轴,计算各项数据与预测数据的斜率作为趋势特征值。
趋势特征值的计算原理图如图3所示。设持续时间限度为T,队列填满的次数为τ,标定数据为ζ,ap和aq采集的第p项数据和第q项数据,其中q<p。在队尾的M项数据中,若ap与aq近似,即该两项数据的差小于设定的限度,释放aq~ap-1并将ap右移至aq所在位置;若记录数据期间初次填满了队列,即τ=1,则将预测数据a0的值传给ζ,计算ζ与队列中每项数据的斜率作为趋势特征值,如果趋势特征值满足以下两种条件的任意一种,则触发预警信号:
1)超过给定的预警限度;
2)趋势特征值持续时间超过了时间限度T,即监测数据整体变化趋势在满足单一单调性的情况下持续了T时间。
考虑到通过人工干预改善矿井工作环境的情况,如果队列中有k项以上数据与a1近似,则清空ζ并将计时时间T和队列填满次数τ置0。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种基于趋势特征值和改进随机森林的煤矿灾害预警方法,其特征在于,该方法包括:根据预测数据和判断数据整体变化趋势两方面来预测灾害预警等级,当其中任一方面的预测结果达到预警条件,则进行预警;
在预测数据方面,应用AHP-RF算法得到传感器监测数据预测值,即是将决策单元分成五个区间,应用层次分析法得到决策值分布的权重矩阵,由各区间权重系数改进传统随机森林算法中的投票机制,通过权重加权平均得到最终的预测值;
在判断数据整体变化趋势方面,应用Savitzky-Golay算法对原始传感器监测数据进行平滑处理,设置采样频率为f1,将n-1组数据按时间顺序传至特征值队列中,再通过AHP-RF算法得到一项整体趋势的预测数据置于队尾,如果队列的数据满足单一单调性,以时间为横轴,计算各项数据与预测数据的斜率作为趋势特征值,以此来表现传感器监测数据的变化趋势并给出相应的灾害预警等级;其中,AHP-RF算法为基于层次分析法改进的随机森林算法。
2.根据权利要求1所述的煤矿灾害预警方法,其特征在于,在预测数据方面,应用AHP-RF算法得到传感器监测数据预测值,具体包括:将各传感器监测数据按特定监测点进行分类,根据每个监测点内数据之间的关系拟合成多元复合函数H(x;y)的形式,其中x表示判断灾害预报警等级的特征因素,y表示影响该特征因素的各项监测指标;将复合函数值送入AHP-RF算法进行预测,该算法是在传统的随机森林算法上对投票机制进行改进,具体为:随机森林的预测单元为CART决策树,设训练集样本总量为H,分割比例为β,随机森林的树木数量为R;
CART决策树用条件Gini系数选择最优特征;设决策树样本为D,按照特征A进行分类,有
其中,D1、D2分别为按照特征A分类后的两类样本;生成CART决策树后,使用均方误差σ作为模型误差的度量指标,即
选择最贴近均方误差σ的分类值作为预测值λ,将每个CART决策树的预测值从大到小排列,根据最大预测差值max{Δλ}将预测数据组等分为五个部分,即R1~R5;统计每个分位区间预测数据量占总数据量的比例,以各个区间的相对比例作为矩阵的标度χij,即
其中,εi表示第i个分位区间预测数据量占总数据量的比例;根据每个标度的方根权重系数计算每个区间的权重,即
其中,为方根法权重系数,ωi为权重;计算出权重后,对各区域的数据进行加权平均运算得到预测数值,即
其中,θ为预测数据;对该数据进行灾害临界值判定,设μi为各项传感器监测数据的临界值,其判定公式如下:
其中,η为预测数据相对于临界值的位置。
3.根据权利要求2所述的煤矿灾害预警方法,其特征在于,所述判断灾害预报警等级的特征因素包括进风巷的氧气浓度数据,受风速数据和风向数据影响;回风隅角的甲烷浓度数据和一氧化碳浓度数据;回风巷的温度数据、甲烷浓度数据和一氧化碳浓度数据,其中,甲烷浓度数据和一氧化碳浓度数据受温度数据和风速数据影响。
4.根据权利要求1所述的煤矿灾害预警方法,其特征在于,在判断数据整体变化趋势方面,计算趋势特征值的具体方法为:设持续时间限度为T,队列填满的次数为τ,标定数据为ζ,ap和aq为采集的第p项数据和第q项数据,其中q<p;在队尾的M项数据中,若ap与aq近似,即该两项数据的差小于设定的限度,释放aq~ap-1并将ap右移至aq所在位置;若记录数据期间初次填满了队列,即τ=1,则将预测数据a0的值传给ζ,计算ζ与队列中每项数据的斜率作为趋势特征值。
5.根据权利要求1或4所述的煤矿灾害预警方法,其特征在于,在判断数据整体变化趋势方面,如果趋势特征值满足以下两种条件的任意一种,则触发预警信号:
1)超过给定的预警限度;
2)趋势特征值持续时间超过了时间限度T,即监测数据整体变化趋势在满足单一单调性的情况下持续了T时间;
考虑到通过人工干预改善矿井工作环境的情况,如果队列中有k项以上数据与a1近似,则清空ζ并将计时时间T和队列填满次数τ置0。
CN202311143714.3A 2023-09-06 2023-09-06 一种基于趋势特征值和改进随机森林的煤矿灾害预警方法 Pending CN117172379A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311143714.3A CN117172379A (zh) 2023-09-06 2023-09-06 一种基于趋势特征值和改进随机森林的煤矿灾害预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311143714.3A CN117172379A (zh) 2023-09-06 2023-09-06 一种基于趋势特征值和改进随机森林的煤矿灾害预警方法

Publications (1)

Publication Number Publication Date
CN117172379A true CN117172379A (zh) 2023-12-05

Family

ID=88940774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311143714.3A Pending CN117172379A (zh) 2023-09-06 2023-09-06 一种基于趋势特征值和改进随机森林的煤矿灾害预警方法

Country Status (1)

Country Link
CN (1) CN117172379A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117536691A (zh) * 2024-01-09 2024-02-09 枣庄矿业集团新安煤业有限公司 一种综采工作面设备参数监控方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117536691A (zh) * 2024-01-09 2024-02-09 枣庄矿业集团新安煤业有限公司 一种综采工作面设备参数监控方法及系统
CN117536691B (zh) * 2024-01-09 2024-04-05 枣庄矿业集团新安煤业有限公司 一种综采工作面设备参数监控方法及系统

Similar Documents

Publication Publication Date Title
CN110263846B (zh) 基于故障数据深度挖掘及学习的故障诊断方法
CN106022561A (zh) 驾驶行为综合评价方法
CN117172379A (zh) 一种基于趋势特征值和改进随机森林的煤矿灾害预警方法
CN109649396B (zh) 一种营运车辆驾驶员安全性检测方法
CN108682149A (zh) 基于二项Logistic回归的公路事故黑点路段线形致因分析方法
CN111027256A (zh) 一种基于车辆荷载空间分布的桥梁风险预测方法及系统
CN112382086A (zh) 自动驾驶汽车开放道路测试评价系统的使用方法
CN111563555A (zh) 一种司机驾驶行为分析方法及系统
CN114741974A (zh) 一种公路隧道火灾增长期参数识别与预测方法
CN117238126A (zh) 一种连续流道路场景下的交通事故风险评估方法
CN112395684A (zh) 一种高速列车走行部系统智能故障诊断方法
CN116451322A (zh) 基于贝叶斯优化的lstm深度学习网络的力学预测方法
CN111191855A (zh) 一种基于管网多元水质时序数据的水质异常事件识别预警方法
CN114417729A (zh) 一种基于bp神经网络的矿区环境安全预警方法
CN117610932B (zh) 一种基于人工智能的公交运营风险管控系统
CN104750953A (zh) 中小尺度气载物质大气输运集合扩散模拟方法
CN116681330A (zh) 一种公路隧道机电系统运行状态分类及综合评价方法
CN111950867A (zh) 一种突发水环境污染应急的技术评估方法
CN118015838B (zh) 结合物联网的隧道车辆流动控制方法及系统
CN111369062A (zh) 车辆动力学指标提取方法和事故风险值预测方法
CN117985077B (zh) 利用无线通信实现铁路沿线施工列车接近智能预警方法
CN117893100B (zh) 基于卷积神经网络的质量评价数据更新模型的构建方法
CN117992810B (zh) 一种道路桥梁强度检测装置
Xiao Application of Big Data Analysis in Bridge Monitoring System
CN116070524A (zh) 一种基于人工智能的寒区洪水预报方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination