CN115860582A - 一种基于自适应提升算法的冲击危险性智能预警方法 - Google Patents

一种基于自适应提升算法的冲击危险性智能预警方法 Download PDF

Info

Publication number
CN115860582A
CN115860582A CN202310175084.1A CN202310175084A CN115860582A CN 115860582 A CN115860582 A CN 115860582A CN 202310175084 A CN202310175084 A CN 202310175084A CN 115860582 A CN115860582 A CN 115860582A
Authority
CN
China
Prior art keywords
data
early warning
impact
training
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310175084.1A
Other languages
English (en)
Other versions
CN115860582B (zh
Inventor
王蕊
陈绍杰
田刚
石永奎
赵卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202310175084.1A priority Critical patent/CN115860582B/zh
Publication of CN115860582A publication Critical patent/CN115860582A/zh
Application granted granted Critical
Publication of CN115860582B publication Critical patent/CN115860582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于自适应提升算法的冲击危险性智能预警方法,属于矿业和信息技术领域,包括如下步骤:结合煤矿采场的实际情况,利用监测数据分析影响煤矿冲击地压危险性的主控因素,根据监测数据和主控因素共同分析主控因素与冲击地压的关系,确定影响冲击危险性的指标;对影响冲击危险性的指标进行预处理,对预处理的数据进行挖掘和整理,生成冲击危险性预警模型所需的冲击地压数据;综合考虑各指标的交互影响,基于自适应提升算法构建冲击危险性预警模型并进行训练;实时获取采场状态数据,通过训练完成的模型对冲击危险性进行智能实时预警。本发明预警方法的精度较高,可以有效实现采场冲击危险性的识别。

Description

一种基于自适应提升算法的冲击危险性智能预警方法
技术领域
本发明属于矿业和信息技术领域,具体涉及一种基于自适应提升算法的冲击危险性智能预警方法。
背景技术
针对冲击地压预警这一世界难题,通过多年来的系统研究,在理论和技术方面已经形成了许多重要成果,也积累了丰富的经验,但当前在冲击危险性评价理论和方法上仍有一些关键性的问题亟待解决。主要体现在,用于准确评价和预警冲击危险性的技术和方法尚未建立,尤其是在评价指标、危险判据和预警模型的有效性及普适性方面还有大量的工作需要深入研究。提高冲击危险性预警水平需要在理论分析、经验类比等方法的基础上,综合采用多种手段进行联合监测,根据研究各种监测信息与冲击地压孕育各阶段之间的关系,以及这些信息的时空变化规律,建立冲击危险性识别指标与模型。除此之外,在冲击地压危险状态判识过程中会出现各种复杂的现象,监测数据与包括地质条件和采掘条件在内的各种信息交织在一起,既有重复又相互矛盾,如何综合利用各参量信息,统一各参量指标的异常指数,最终实现对预警结论的一致性描述,是当前冲击地压监测预警的重要课题。
简言之,发生在采动空间周围、以冲击地压为代表的采场动力灾害严重影响着煤矿安全生产。如何有效地对冲击危险性进行预警以减轻冲击地压引起的灾害,是采场开采亟待解决的问题。
发明内容
为了解决上述问题,本发明提出了一种基于自适应提升算法的冲击危险性智能预警方法,收集影响采场动力灾害发生的时空参数,构建采场状态大数据,通过对其进行挖掘分析有效地发现异常情况并及时警报。
本发明的技术方案如下:
一种基于自适应提升算法的冲击危险性智能预警方法,包括如下步骤:
步骤1、结合煤矿采场的实际情况,利用监测数据分析影响煤矿冲击地压危险性的主控因素,根据监测数据和主控因素共同分析主控因素与冲击地压的关系,确定影响冲击危险性的指标;
步骤2、对影响冲击危险性的指标进行预处理,对预处理后的数据进行挖掘和整理,生成训练冲击危险性预警模型所需的冲击地压数据;
步骤3、综合考虑各指标的交互影响,基于自适应提升算法构建冲击危险性预警模型,对构建的模型进行训练,得到最终的预警模型;
步骤4、实时获取采场状态数据,通过训练完成的冲击危险性预警模型对冲击危险性进行智能实时预警。
进一步地,步骤1中,监测数据包括煤体应力监测数据、微震监测数据、支架阻力监测数据;主控因素包括地质因素和采掘因素;地质因素包括开采深度、煤层的物理力学特性、顶板岩层的结构特征、地质构造;采掘因素包括上覆煤层的停采线、残采区、采空区、煤柱、老巷、开采区域的大小;分析关系时,确定采区地质因素和采掘因素中每个因素对冲击地压的影响程度,以及确定每个因素对冲击危险状态的影响指数,将影响程度和影响指数进行融合,形成冲击地压危险状态等级评定的指标体系。
进一步地,步骤2的具体过程为:
步骤2.1、通过去噪、规范化处理的方式对影响冲击危险性的指标数据进行预处理,构造用于数据分析的数据集,并采用mat()函数将数据集转换成矩阵;
步骤2.2、采用独立成分分析的特征抽取技术,将数据集转换的特征矩阵生成低维数矩阵,同时保留数据集中高相关度的信息。
进一步地,步骤3的具体过程为:
步骤3.1、选择步骤2中生成的冲击地压数据中的一部分数据作为训练数据集
Figure SMS_1
,其中,
Figure SMS_2
为训练样本的个数,每个样本点由实例与标签组成,
Figure SMS_3
代表数据集中第
Figure SMS_4
个训练样本实例,
Figure SMS_5
代表数据集中第
Figure SMS_6
个训练样本的标签;剩余的另一部分数据作为测试数据集;
步骤3.2、通过公式(1)初始化所有训练样本的权重,每一个训练样本初始时被赋予相同的权值,
Figure SMS_7
(1);
其中,
Figure SMS_8
表示第一次迭代中实例
Figure SMS_9
的权重,
Figure SMS_10
为训练样本的个数;
步骤3.3、迭代训练决策树弱分类器
Figure SMS_11
,最大的迭代次数设置为
Figure SMS_12
;第
Figure SMS_13
次迭代的训练过程如下:
步骤3.3.1、使用
Figure SMS_14
和第
Figure SMS_15
次迭代权重
Figure SMS_16
训练弱分类器
Figure SMS_17
Figure SMS_18
(2);
其中,
Figure SMS_19
表示
Figure SMS_20
的第
Figure SMS_21
个属性数据,
Figure SMS_22
是第
Figure SMS_23
次迭代中第
Figure SMS_24
个属性的阈值,
Figure SMS_25
是属性的方向;
步骤3.3.2、计算每个属性的决策树弱分类器的误差率
Figure SMS_26
Figure SMS_27
(3);
其中,
Figure SMS_28
是零一损失函数:
Figure SMS_29
(4);
步骤3.3.3、计算弱分类器在最终的强分类器中所占的权重
Figure SMS_30
Figure SMS_31
(5);
其中,
Figure SMS_32
为第
Figure SMS_33
次迭代中弱分类器的误差率;
步骤3.3.4、更新样本的权重分布,
Figure SMS_34
(6);
其中,初始值
Figure SMS_35
由公式(1)计算得到,
Figure SMS_36
表示
Figure SMS_37
中的任意样本;
Figure SMS_38
是样本
Figure SMS_39
的类标签,计算公式如下:
Figure SMS_40
(7);
步骤3.4、迭代训练步骤3.3,按弱分类器权重
Figure SMS_41
得到一个强分类器
Figure SMS_42
Figure SMS_43
(8);
其中,
Figure SMS_44
表示符号函数;
步骤3.5、视冲击危险性识别预警为二分类问题,则数据集中类别
Figure SMS_45
=2,因此通过训练生成一个强分类器
Figure SMS_46
,利用强分类器
Figure SMS_47
进行冲击危险性识别,
Figure SMS_48
(9);
其中,
Figure SMS_49
表示冲击危险性识别结果;
步骤3.6、将测试数据集输入强分类器得出分类结果,分类结果对应冲击危险性识别结果,如果存在冲击危险性,则发布预警;将分类结果与测试数据集标签数据进行对比,当比对结构表示模型性能良好时,保存当前训练完成的模型;否则重新训练模型,直至训练得到性能良好的模型。
本发明所带来的有益技术效果:
本发明利用大数据挖掘技术和机器学习方法可以实现采场冲击危险性的识别,具有较好的通用性;提出了自适应提升算法来对冲击危险性进行判识预警,通过对采场状态进行分类,可以快速感知采场当前的危险状态,提高了识别结果的准确性;本发明预警方法的精度达到了93%,能够胜任冲击危险性预警任务。
附图说明
图1为本发明基于自适应提升算法的冲击危险性智能预警方法的整体流程图;
图2为本发明基于自适应提升算法的冲击危险性智能预警方法的过程框图;
图3为本发明基于Spark的动力灾害大数据融合与处理框架图;
图4为本发明实验中模型性能对比结果图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明。
本发明基于大数据挖掘技术和机器学习方法,提供一种实时高效的在线判识冲击危险性的方法,该方法能够集成采场状态相关的多元参数,获取关联维度信息进行指标结构分析、趋势分析,以快速感知当前冲击地压危险状态和未来的发展趋势;该方法能够从粗粒度到细粒度进行数据挖掘,在采场掘进过程中根据地层信息的变化、危险源分布及特征和围岩应力在线监测信息,对冲击危险性进行动态预警。根据预警结果,及时、准确地做出防控响应,有效地降低冲击地压事故的发生几率,保障矿井的高效化采煤,为矿下工作人员提供安全的工作环境。因此,本发明研究得到的采场状态时空参数融合及冲击危险性感知预警方法,具有十分重要的理论研究意义和实际应用价值。
如图1所示,一种基于自适应提升算法的冲击危险性智能预警方法,包括以下步骤:
步骤1、结合煤矿采场的实际情况,利用煤体应力监测、微震监测、支架阻力监测等监测数据,分析影响煤矿冲击地压危险性的主控因素,并将这些主控因素划分为地质因素和采掘因素,从采掘地质条件和监测数据两个方面分析这些因素与冲击地压的关系,确定影响冲击危险性的指标。
影响冲击地压危险性的主控因素有地质方面的因素,包括开采深度、煤层的物理力学特性、顶板岩层的结构特征、地质构造等,也有采掘方面的因素,包括上覆煤层的停采线、残采区、采空区、煤柱、老巷、开采区域的大小等。根据这些冲击地压影响因素的分析,确定采区地质因素和采掘因素中的每个因素对冲击地压的影响程度,以及确定每个因素对冲击危险状态影响的指数,将其融合起来,形成冲击地压危险状态等级评定的指标体系,本发明选取煤层厚度、煤层倾角、支架型式、支护阻力、微震能量、钻孔应力、老顶初次来压步距和老顶周期来压步距作为评价指标体系。
步骤2、对影响冲击地压的指标进行预处理,以形成能够支持冲击危险性预警需要的数据集;对预处理后的数据进行挖掘和整理,生成训练冲击危险性预警模型所需的冲击地压数据。具体过程如下:
步骤2.1、通过去噪、规范化处理的方式对影响冲击危险性的指标数据进行预处理,构造用于数据分析的数据集,并采用mat()函数将数据集转换成矩阵。本发明通过定义规则去除数据噪音,采用z-score方法进行规范化处理;定义规则为:(a)出现属性值空缺时,按空缺程度分别进行处理。数据对象中属性值空缺3项以上时,删除该数据对象;属性值空缺少于3项时,使用相邻数据对象对应的属性值进行填充。(b)数据对象中属性值的类型非法或格式非法时,删除该数据对象。(c)数据对象中属性值为乱码时,删除该数据对象。(d)定性变量转化为数值型变量。例如,采场动力灾害样本数据中的液压支架形式为类别型变量,该变量的取值为{“支撑式”、“掩护式”、“支撑掩护式”},本发明将其取值分别用0、1、2表示。
步骤2.2、采用独立成分分析的特征抽取技术,将数据集转换的特征矩阵生成维数较低的矩阵,同时保留数据集中高相关度的信息,这不仅通过降低数据维度加速了数据分析,还通过消除固有的数据依赖关系来改善数据分析。
步骤3、综合考虑各指标的交互影响,基于自适应提升算法构建冲击危险性预警模型,对构建的模型进行求解,估计模型参数,得到最终的预警模型。自适应提升算法为一种机器学习方法。具体过程如下:
步骤3.1、数据准备。选择步骤2中的一部分数据作为训练数据集
Figure SMS_51
,其中,
Figure SMS_52
为训练样本的个数,每个样本点由实例与标签组成,
Figure SMS_54
代表数据集中第
Figure SMS_56
个训练样本实例,
Figure SMS_57
代表数据集中第
Figure SMS_58
个训练样本的标签。实例
Figure SMS_59
,标签
Figure SMS_50
Figure SMS_53
是实例空间,包含煤层厚度、煤层倾角、支护阻力、微震能量、钻孔应力等,
Figure SMS_55
是标签集合。步骤2中生成的冲击地压数据中剩余的一部分数据作为测试数据集。
步骤3.2、初始化样本权重。通过公式(1)初始化所有训练样本的权重,每一个训练样本初始时都被赋予相同的权值,
Figure SMS_60
(1);
其中,
Figure SMS_61
表示第一次迭代中实例
Figure SMS_62
的权重,
Figure SMS_63
为训练样本的个数。
步骤3.3、训练决策树弱分类器。
这是关键步骤,迭代训练决策树弱分类器
Figure SMS_64
,最大的迭代次数设置为
Figure SMS_65
,最大的迭代次数为决策树弱分类器的个数。第
Figure SMS_66
次迭代的训练过程如下:
步骤3.3.1、使用
Figure SMS_67
和第
Figure SMS_68
次迭代权重
Figure SMS_69
训练弱分类器
Figure SMS_70
Figure SMS_71
(2);
其中,
Figure SMS_73
表示
Figure SMS_75
的第
Figure SMS_77
个属性数据,即矿山数据集中的煤层厚度、煤层倾角、支护阻力等属性的数据,
Figure SMS_79
是第
Figure SMS_80
次迭代中第
Figure SMS_82
个属性的阈值,
Figure SMS_84
是属性的方向。可以看出,决策树的分类过程就是将
Figure SMS_72
的值与
Figure SMS_74
进行比较。如果
Figure SMS_76
大于
Figure SMS_78
,则输出为
Figure SMS_81
,否则
Figure SMS_83
步骤3.3.2、计算每个属性的决策树弱分类器的误差率
Figure SMS_85
Figure SMS_86
(3);
其中,
Figure SMS_87
是零一损失函数:
Figure SMS_88
(4);
步骤3.3.3、计算弱分类器在最终的强分类器中所占的权重
Figure SMS_89
Figure SMS_90
(5);
其中,
Figure SMS_91
为第
Figure SMS_92
次迭代中弱分类器的误差率;
步骤3.3.4、更新样本的权重分布,即用于下一个弱分类器的每个样本的权重,
Figure SMS_93
(6);
其中,初始值
Figure SMS_94
由公式(1)计算得到,
Figure SMS_95
表示
Figure SMS_96
中的任意样本数据;
Figure SMS_97
是样本
Figure SMS_98
的类标签,计算公式如下:
Figure SMS_99
(7);
步骤3.4、迭代训练步骤3.3,按弱分类器权重
Figure SMS_100
得到一个强分类器
Figure SMS_101
Figure SMS_102
(8);
其中,
Figure SMS_103
表示符号函数,通过符号函数的作用,得到最终的强分类器
Figure SMS_104
步骤3.5、在本发明中,视冲击危险性识别预警为二分类问题,则数据集中类别
Figure SMS_105
=2,因此通过训练生成一个强分类器
Figure SMS_106
,利用强分类器
Figure SMS_107
进行冲击危险性识别,
Figure SMS_108
(9);
其中,
Figure SMS_109
表示冲击危险性识别结果。
步骤3.6、将测试数据集输入强分类器得出分类结果,即冲击危险性识别结果,如果存在冲击危险性,则发布预警。将分类结果与测试数据集标签数据进行对比,当比对结构表示模型性能良好时,保存当前训练完成的模型;否则重新训练模型,直至训练得到性能良好的模型。
基于自适应提升算法的冲击危险性智能预警过程的伪代码如下:
算法1 基于自适应提升算法的冲击危险性识别预警过程;
输入:训练集:采场状态数据集
Figure SMS_110
,数据集中类数:
Figure SMS_111
=2,决策树弱分类器的个数(即最大的迭代次数):
Figure SMS_112
输出:强分类器
Figure SMS_113
,冲击危险性分类结果
Figure SMS_114
1: For
Figure SMS_115
= 1:
Figure SMS_116
2:For
Figure SMS_117
:
Figure SMS_118
3:选择原始训练集的样本
Figure SMS_119
和样本
Figure SMS_120
作为新的训练集
Figure SMS_121
4:训练样本的权重初始化为
Figure SMS_122
5:For
Figure SMS_123
= 1:
Figure SMS_124
6:使用
Figure SMS_125
Figure SMS_126
,最优弱分类器
Figure SMS_127
由式(2)训练而来;
7:从式(3)计算
Figure SMS_128
的误差率
Figure SMS_129
8:基于式(5),计算
Figure SMS_130
的权重
Figure SMS_131
9:基于式(6),更新样本的权重分布
Figure SMS_132
10:End For;
11:End For;
12: End For;
13: 基于式(8),生成强分类器
Figure SMS_133
14: 测试数据输入强分类器
Figure SMS_134
15: Return 冲击危险性识别结果;
16: 发布预警;
步骤4、实时获取采场状态数据,通过训练完成的冲击危险性预警模型对冲击危险性进行智能实时预警。
为了证明本发明自适应提升算法的可行性与优越性,进行了如下实施例。
本发明实施例中,利用大数据挖掘技术进行数据收集和处理,具体采用大数据平台记录并融合动力灾害多元参数。通过现场调研采集某工作面冲击地压发生位置的定量指标,并基于实践研究与实测方法确定定性指标。
如图2所示,整个方法概述为以下过程:
在数据融合与处理时,收集与采场动力灾害相关的信息,包括围岩动态信息、支护工况信息等方面的动态信息,以及地质信息、采掘信息等方面的静态信息。动态信息和静态信息共同构成数据监测阶段得到数据信息。其中,地质信息、采掘信息、围岩动态信息为数据监测的主数据,支护工况信息为辅助数据。在对监测数据进数据处理时,搭建了大数据处理平台,采用的处理方法包括自适应提升算法、数据多元参数融合、去噪和规范化处理。
在预警模型构建与训练时,基于自适应提升算法构建预警模型,并对模型进行求解和模型估计。
在预警模型在线应用时,将训练完成的预警模型应用到实际的采场区域,对冲击危险性进行实时判识,进行实时的在线预警。
煤矿装备了不同厂家的在线监测系统(包括支架阻力监测系统、巷道围岩顶板离层监测系统、锚杆/锚索阻力监测系统、煤体应力监测系统、微震监测系统等),本发明采用AMPreAlert Plat布置自主研发的各类在线监测子系统,并采用文件传输协议FTP方式融合各类第三方厂家的在线监测系统的监测信息,最后采用自定义的数据存储方式进行存储。综上,采用数据库、三维地质模型、文件、流媒体等技术,在大数据处理平台构建将影响采场安全的地质信息、采掘信息和动态感知信息(在线监测信息)融为一体的工作面安全预警大数据,为采场动力灾害预警提供信息基础。
采场时空数据的特点符合大数据的4V特点。本发明采用集成大数据处理技术的管理框架,如图3所示,对采场动力灾害相关数据进行智能化记录和融合处理。具体过程为:
假设原始数据包括三个
Figure SMS_135
,则经过Spark Streaming流处理后,对应形成按时刻分片后的数据
Figure SMS_136
,然后再经过Spark引擎处理,得到处理后的数据为
Figure SMS_137
根据采场时空数据采集的频率,选择天、小时、分钟等单位,通过Kafka消息队列传输数据,并通过Spark Streaming流式处理框架中的KafkaInputDStream输入流(又称为Kafka连接器),将数据进行切片保存为弹性分布式数据集(Resilient DistributedDatasets,RDD)形式的数据,增量式分批对数据进行处理,可以满足处理过程的高效性。为了进一步加快采场时空数据处理的过程,执行RDD的Map转换对原始数据(如图3中的指标1、指标2)进行去噪、规范化处理,保留对冲击危险性预警分析有价值的数据(如图3中的指标1’ 、指标2’)。对采场时空数据遍历的同时,从中抽取所需要的属性,按照时间窗口W计算所需的度量指标(如图3中的指标1’’ 、指标2’’)。为了得到可以支持对冲击危险性进行预警的数据,在Map阶段,对原始数据进行分组,并按照数据采集的事务类型将其划分到不同的工作节点。在Reduce阶段,将处理后的数据按照时空同步机制集成,即将每个时空点上的地质信息、采掘信息及监测数据等相关信息进行关联,如图3中{某时刻开始, 某时刻结束,指标1’’, 指标2’’,位置坐标}。将Spark作业得到的数据通过DriverManager驱动管理器汇总存入MySQL数据库,MySQL数据库支持多字段索引检索、时间序列检索及空间数据查询,能够快速检索定位所需数据,生成冲击危险性预警算法能够识别的数据集。
本发明对采场时空数据进行融合处理,考虑了相关信息的充分性、必要性和互补性,在数据库中建立时序索引、实体关联索引和事务索引,为信息处理和分析提供高效的检索手段,从而满足对冲击危险性进行在线预警的时效性要求。利用Spark所提供的SparkStreaming计算框架,把采场状态大数据按时间片分成多个小体积的数据单元,实现该数据的实时在线处理;利用SparkSQL提供的查询方法,实现动力灾害数据的关系运算和查询操作;利用Spark提供的编程语言和资源,开发具有复杂业务逻辑的采场动力灾害数据处理程序,实现冲击危险性预警算法。
基于上述方式获取某煤矿有关采场动力灾害数据,将其预处理后作为样本数据集,该数据集共1248组数据,数据集示例见表1所示。其中,样本数据集中选取煤层厚度、煤层倾角、支架型式、支护阻力、微震能量、钻孔应力、老顶初次来压步距和老顶周期来压步距作为评价指标;实测值为0表示不存在冲击危险性,实测值为1表示存在冲击危险性。通过对数据进行整理合并,得到包含本身信息的特征,对其进行二分类,并以7:3的比例将数据集划分为训练集与测试集。
表1 样本数据集;
工作面名称 煤层厚度/m 煤层倾角/度 支架型式 支护阻力/Mpa 微震能量/105J 钻孔应力/Mpa 老顶初次来压步距/m 老顶周期来压步距/m 实测值
23104 35 12 2 41 15.13 15.76 90 90 0
23104 35 12 2 33 2.2 15.34 90 90 0
23201 30 8 2 37 17.94 15.68 11 12 0
23201 30 8 2 40 16.36 15.28 11 12 0
23202 35 8 2 40 19.58 15.16 50 50 1
23202 35 8 2 30 17.84 15.86 50 50 0
23203 4.8 1 1 39 17.07 15.76 100 100 1
23203 4.8 1 1 31 17.7 15.04 100 100 0
23301 35 8 2 13 18.51 15.58 72 42 0
23301 35 8 2 6 4.55 15.19 72 42 0
然后,在3.9GHz Intel i5 7300HQ CPU计算机上进行对比实验,使用的是python3.6版本。本发明对比实验选择Bi-GRU模型、ALBert+LSTM模型、KNN模型、SVM模型、HMM模型五个模型与本发明自适应提示算法模型AdaBoost进行对比,在训练过程中,每个模型设置的具体参数如下:
Bi-GRU模型中,学习率设置为1e-4,训练轮次设置为200,批量大小设置为8,优化器选用Adam,嵌入向量维度设置为300;
ALBert+LSTM模型中,学习率设置为1e-5,训练轮次设置为20,批量大小设置为4,嵌入向量维度设置为200,编码器选用Transformer;
KNN模型中,分别选取k为1到8,测试后k选取为5;
SVM模型中,核函数选用RBF,惩罚参数设置为2;
HMM模型中,训练集比例设置为0.7,训练轮次设置为25;
AdaBoost模型中,树的最大深度限制为2,训练轮次设置为40,弱分类器选用决策树,测试集比例设置为0.2。
上述六个模型比较结果如下:
Bi-GRU是一种门控循环神经网络,更好地捕捉时序数据中间隔较大的依赖关系,具有门控循环单元。Bi-GRU分类对数据进行了特征提取和融合等处理,数据融合的方法在PyTorch中实现。对于编码器架构,设置自注意块和注意头为2,嵌入向量维度为300,最大序列长度为50。该模型采用Adam优化器进行优化,学习率为0.001,
Figure SMS_138
= 0.9,
Figure SMS_139
= 0.999,批量大小为200。使用深度神经网络编码每条数据的信息序列。为了不失一般性,定义一个序列编码器编码一条数据序列S并输出所有位置的数据表示,在经过编码器得到对应的序列表征集合
Figure SMS_140
,将其聚合后得到向量表示当前整个序列的表征
Figure SMS_141
,采用的聚合方式是拼接。
ALBert+LSTM是一种分类模型,本实验中,使用BERT预训练模型进行迁移学习,从而进行数据分类。BERT是一个基于Transformer的预训练语言表征模型,其模型架构是一个多层双向Transformer编码器。为了能够预训练一个深度双向Transformer,BERT通过使用MLM预训练目标使得模型能够融合数据信息来获得双向数据表示。首先简单地随机屏蔽15%的输入标记,然后对这些掩蔽标记进行预测。具体采用的策略为,将被屏蔽的数字按照以下规则替换(1)80%是用[MASK]标记替换这个数。(2)10%是用一个随机的数替换这个数。(3)10%是保持这个数不变。
KNN模型按照距离远近排序,传入一个测试点数据,计算它和训练集中所有点的距离,并进行距离近远排序,可选择邻居个数来确定测试点属于哪一类,具体来说需要计算一条数据序列S的L2范式求特征值,然后求最大特征值得算术平方根,进而计算距离近远进行排序。其中在计算距离时对一个矿山样本数据与其他所有的样本数据对其煤层厚度、煤层倾角、支护阻力、钻孔应力等信息通过L2范式计算出他们之间的距离。对于每一对矿山数据样本的排序,从中选取距离最近的k个样本通过投票法获取最终的预测标签。
SVM是一种分类模型,是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。它是将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。设置惩罚参数C为2,使其对测试集准确率达到最好的效果,核函数采用rbf。
HMM是一种隐马尔可夫分类模型,用隐马尔可夫模型可以做更多的事情,例如分类,有不同的序列集属于不同的类。首先,训练每组的模型,然后给出一个新的观察序列,可以通过计算每个模型的可能性对其进行分类,并预测具有最高对数似然的模型。HMM模型主要做了三件事:(1)先验概率:处于序列的第一状态的概率的向量。(2)过渡概率:矩阵描述从一种状态到另一种状态的概率。(3)排放概率:矩阵描述在给定状态的情况下观察输出的概率。
本发明方法采用的AdaBoost模型也是一种分类模型,AdaBoost是AdaptiveBoosting(自适应提升)的缩写,它的自适应在于:被前一个基本分类器误分类的样本的权值会增大,而正确分类的样本的权值会减小,并再次用来训练下一个基本分类器。同时,在每一轮迭代中,加入一个新的弱分类器,直到达到某个预定的足够小的错误率或预先指定的最大迭代次数再确定最后的强分类器。
本发明模型分别与Bi-GRU、ALBert+LSTM、KNN、SVM和HMM模型进行了对比研究。在测试集上的准确率如表2所示。
表2 模型对比结果;
模型 准确率(%) 召回率(%) F1值(%)
ALBert+LSTM 84.3 16 25
Bi-GRU 89.6 50.00 47.55
KNN 90.7 69.25 71.91
SVM 93.3 68.57 74.85
HMM 86.7 48.76 56.62
AdaBoost 93.6 70.42 75.12
图4展示了六个模型的性能对比结果,结合图4和表2可以看出,采用实验中所使用的6种模型进行冲击危险性分类,其中本发明AdaBoost模型相较于其他的模型效果最优,KNN模型进行矿山数据分类分别选取了k的个数从1到8,k指的是k个邻近样本,k=n就是根据最近的n个样本来判断待定样本的类别,其中当k=5时准确率达到了90.7%、召回率达到了69.25%和F1值达到了71.91%,当随着k值增加准确率反而下降,最终准确率为90.7%、召回率为69.25%和F1值为71.91%。本发明AdaBoost模型最终准确率为93.6%、召回率为70.42%和F1值为75.12%,在进行冲击危险性分类任务上表现更为优异。
本发明利用大数据挖掘技术和机器学习方法实时地对冲击危险性进行智能感知预警。经实验证明,本发明方法具有比较好的效果,对实现采场冲击地压灾害可防可控具有重要意义。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (4)

1.一种基于自适应提升算法的冲击危险性智能预警方法,其特征在于,包括如下步骤:
步骤1、结合煤矿采场的实际情况,利用监测数据分析影响煤矿冲击地压危险性的主控因素,根据监测数据和主控因素共同分析主控因素与冲击地压的关系,确定影响冲击危险性的指标;
步骤2、对影响冲击危险性的指标进行预处理,对预处理后的数据进行挖掘和整理,生成训练冲击危险性预警模型所需的冲击地压数据;
步骤3、综合考虑各指标的交互影响,基于自适应提升算法构建冲击危险性预警模型,对构建的模型进行训练,得到最终的预警模型;
步骤4、实时获取采场状态数据,通过训练完成的冲击危险性预警模型对冲击危险性进行智能实时预警。
2.根据权利要求1所述基于自适应提升算法的冲击危险性智能预警方法,其特征在于,所述步骤1中,监测数据包括煤体应力监测数据、微震监测数据、支架阻力监测数据;主控因素包括地质因素和采掘因素;地质因素包括开采深度、煤层的物理力学特性、顶板岩层的结构特征、地质构造;采掘因素包括上覆煤层的停采线、残采区、采空区、煤柱、老巷、开采区域的大小;分析关系时,确定采区地质因素和采掘因素中每个因素对冲击地压的影响程度,以及确定每个因素对冲击危险状态的影响指数,将影响程度和影响指数进行融合,形成冲击地压危险状态等级评定的指标体系。
3.根据权利要求1所述基于自适应提升算法的冲击危险性智能预警方法,其特征在于,所述步骤2的具体过程为:
步骤2.1、通过去噪、规范化处理的方式对影响冲击危险性的指标数据进行预处理,构造用于数据分析的数据集,并采用mat()函数将数据集转换成矩阵;
步骤2.2、采用独立成分分析的特征抽取技术,将数据集转换的特征矩阵生成低维数矩阵,同时保留数据集中高相关度的信息。
4.根据权利要求1所述基于自适应提升算法的冲击危险性智能预警方法,其特征在于,所述步骤3的具体过程为:
步骤3.1、选择步骤2中生成的冲击地压数据中的一部分数据作为训练数据集
Figure QLYQS_1
,其中,
Figure QLYQS_2
为训练样本的个数,每个样本点由实例与标签组成,
Figure QLYQS_3
代表数据集中第
Figure QLYQS_4
个训练样本实例,
Figure QLYQS_5
代表数据集中第
Figure QLYQS_6
个训练样本的标签;剩余的另一部分数据作为测试数据集;
步骤3.2、通过公式(1)初始化所有训练样本的权重,每一个训练样本初始时被赋予相同的权值,
Figure QLYQS_7
(1);
其中,
Figure QLYQS_8
表示第一次迭代中实例
Figure QLYQS_9
的权重,
Figure QLYQS_10
为训练样本的个数;
步骤3.3、迭代训练决策树弱分类器
Figure QLYQS_11
,最大的迭代次数设置为
Figure QLYQS_12
;第
Figure QLYQS_13
次迭代的训练过程如下:
步骤3.3.1、使用
Figure QLYQS_14
和第
Figure QLYQS_15
次迭代权重
Figure QLYQS_16
训练弱分类器
Figure QLYQS_17
Figure QLYQS_18
(2);
其中,
Figure QLYQS_19
表示
Figure QLYQS_20
的第
Figure QLYQS_21
个属性数据,
Figure QLYQS_22
是第
Figure QLYQS_23
次迭代中第
Figure QLYQS_24
个属性的阈值,
Figure QLYQS_25
是属性的方向;
步骤3.3.2、计算每个属性的决策树弱分类器的误差率
Figure QLYQS_26
Figure QLYQS_27
(3);
其中,
Figure QLYQS_28
是零一损失函数:
Figure QLYQS_29
(4);
步骤3.3.3、计算弱分类器在最终的强分类器中所占的权重
Figure QLYQS_30
Figure QLYQS_31
(5);
其中,
Figure QLYQS_32
为第
Figure QLYQS_33
次迭代中弱分类器的误差率;
步骤3.3.4、更新样本的权重分布,
Figure QLYQS_34
(6);
其中,初始值
Figure QLYQS_35
由公式(1)计算得到,
Figure QLYQS_36
表示
Figure QLYQS_37
中的任意样本;
Figure QLYQS_38
是样本
Figure QLYQS_39
的类标签,计算公式如下:
Figure QLYQS_40
(7);
步骤3.4、迭代训练步骤3.3,按弱分类器权重
Figure QLYQS_41
得到一个强分类器
Figure QLYQS_42
Figure QLYQS_43
(8);
其中,
Figure QLYQS_44
表示符号函数;
步骤3.5、视冲击危险性识别预警为二分类问题,则数据集中类别
Figure QLYQS_45
=2,因此通过训练生成一个强分类器
Figure QLYQS_46
,利用强分类器
Figure QLYQS_47
进行冲击危险性识别,
Figure QLYQS_48
(9);
其中,
Figure QLYQS_49
表示冲击危险性识别结果;
步骤3.6、将测试数据集输入强分类器得出分类结果,分类结果对应冲击危险性识别结果,如果存在冲击危险性,则发布预警;将分类结果与测试数据集标签数据进行对比,当比对结构表示模型性能良好时,保存当前训练完成的模型;否则重新训练模型,直至训练得到性能良好的模型。
CN202310175084.1A 2023-02-28 2023-02-28 一种基于自适应提升算法的冲击危险性智能预警方法 Active CN115860582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310175084.1A CN115860582B (zh) 2023-02-28 2023-02-28 一种基于自适应提升算法的冲击危险性智能预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310175084.1A CN115860582B (zh) 2023-02-28 2023-02-28 一种基于自适应提升算法的冲击危险性智能预警方法

Publications (2)

Publication Number Publication Date
CN115860582A true CN115860582A (zh) 2023-03-28
CN115860582B CN115860582B (zh) 2023-05-26

Family

ID=85659326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310175084.1A Active CN115860582B (zh) 2023-02-28 2023-02-28 一种基于自适应提升算法的冲击危险性智能预警方法

Country Status (1)

Country Link
CN (1) CN115860582B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116645732A (zh) * 2023-07-19 2023-08-25 厦门工学院 一种基于计算机视觉的场地危险活动预警方法及系统
CN118280091A (zh) * 2024-06-03 2024-07-02 山东科技大学 一种基于时空事件链的煤矿灾害智能联动方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096853A (zh) * 2016-06-21 2016-11-09 中国矿业大学 一种煤巷掘进冲击矿压危险预评估方法
CN108960653A (zh) * 2018-07-12 2018-12-07 煤炭科学技术研究院有限公司 基于综合指数法的多尺度冲击危险性评价方法
CN109447837A (zh) * 2018-11-15 2019-03-08 国家能源投资集团有限责任公司 一种矿区冲击地压的危险性评估方法
CN111325461A (zh) * 2020-02-18 2020-06-23 山东科技大学 基于振动监测技术的煤层冲击危险性实时评估方法
CN111784136A (zh) * 2020-06-22 2020-10-16 煤炭科学技术研究院有限公司 一种基于层次分析和模糊数学的冲击危险性动态预警方法
CN111859712A (zh) * 2020-08-03 2020-10-30 重庆大学 一种煤矿冲击地压地面超前预控方法
CN113139681A (zh) * 2021-04-13 2021-07-20 合肥综合性国家科学中心能源研究院(安徽省能源实验室) 一种基于时间序列数据的神经网络冲击地压预测方法
CN113469342A (zh) * 2021-07-08 2021-10-01 北京科技大学 一种基于深度学习微震监测数据的冲击地压预警方法
CN113673119A (zh) * 2021-09-07 2021-11-19 重庆大学 基于贝叶斯方法的煤矿冲击地压危险性动静耦合评价方法
CN114169789A (zh) * 2021-12-14 2022-03-11 辽宁工程技术大学 基于层次分析和模糊综合评判的煤矿冲击地压预测方法
CN114241089A (zh) * 2021-12-22 2022-03-25 中煤能源研究院有限责任公司 一种煤矿冲击地压危险区域评价云图的生成方法
CN115577844A (zh) * 2022-10-19 2023-01-06 北京安科兴业矿山安全技术研究院有限公司 一种煤矿冲击地压多参量超前预测预报方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096853A (zh) * 2016-06-21 2016-11-09 中国矿业大学 一种煤巷掘进冲击矿压危险预评估方法
CN108960653A (zh) * 2018-07-12 2018-12-07 煤炭科学技术研究院有限公司 基于综合指数法的多尺度冲击危险性评价方法
CN109447837A (zh) * 2018-11-15 2019-03-08 国家能源投资集团有限责任公司 一种矿区冲击地压的危险性评估方法
CN111325461A (zh) * 2020-02-18 2020-06-23 山东科技大学 基于振动监测技术的煤层冲击危险性实时评估方法
CN111784136A (zh) * 2020-06-22 2020-10-16 煤炭科学技术研究院有限公司 一种基于层次分析和模糊数学的冲击危险性动态预警方法
CN111859712A (zh) * 2020-08-03 2020-10-30 重庆大学 一种煤矿冲击地压地面超前预控方法
CN113139681A (zh) * 2021-04-13 2021-07-20 合肥综合性国家科学中心能源研究院(安徽省能源实验室) 一种基于时间序列数据的神经网络冲击地压预测方法
CN113469342A (zh) * 2021-07-08 2021-10-01 北京科技大学 一种基于深度学习微震监测数据的冲击地压预警方法
CN113673119A (zh) * 2021-09-07 2021-11-19 重庆大学 基于贝叶斯方法的煤矿冲击地压危险性动静耦合评价方法
CN114169789A (zh) * 2021-12-14 2022-03-11 辽宁工程技术大学 基于层次分析和模糊综合评判的煤矿冲击地压预测方法
CN114241089A (zh) * 2021-12-22 2022-03-25 中煤能源研究院有限责任公司 一种煤矿冲击地压危险区域评价云图的生成方法
CN115577844A (zh) * 2022-10-19 2023-01-06 北京安科兴业矿山安全技术研究院有限公司 一种煤矿冲击地压多参量超前预测预报方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张凯;顾士坦;: "不同采掘扰动下的冲击地压危险ANN评价方法", 煤矿安全 *
温廷新;于凤娥;: "基于NRS-ACPSO-SVM的冲击地压危险性预测模型", 中国安全科学学报 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116645732A (zh) * 2023-07-19 2023-08-25 厦门工学院 一种基于计算机视觉的场地危险活动预警方法及系统
CN116645732B (zh) * 2023-07-19 2023-10-10 厦门工学院 一种基于计算机视觉的场地危险活动预警方法及系统
CN118280091A (zh) * 2024-06-03 2024-07-02 山东科技大学 一种基于时空事件链的煤矿灾害智能联动方法

Also Published As

Publication number Publication date
CN115860582B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
CN109635461B (zh) 一种应用随钻参数来自动识别围岩级别的方法和系统
CN115860582B (zh) 一种基于自适应提升算法的冲击危险性智能预警方法
CN112529341B (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
US8090538B2 (en) System and method for interpretation of well data
Leng et al. A hybrid data mining method for tunnel engineering based on real-time monitoring data from tunnel boring machines
CN103390154A (zh) 基于进化多特征提取的人脸识别方法
Niu et al. Susceptibility assessment of landslides triggered by the Lushan earthquake, April 20, 2013, China
CN112270355A (zh) 基于大数据技术与sae-gru的主动安全预测方法
CN109933619B (zh) 一种半监督分类预测方法
EP3938814B1 (en) Automated facies classification from well logs
Zhang et al. Cross-project prediction for rock mass using shuffled TBM big dataset and knowledge-based machine learning methods
CN116384627A (zh) 一种基于机器学习的地质灾害评价方法
CN113431635B (zh) 半监督的盾构隧道掌子面地质类型预估方法及系统
CN116822971B (zh) 一种井壁风险等级预测方法
CN116933920A (zh) 一种矿山井下泥石流的预测预警方法及系统
CN110175194B (zh) 一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法
Efendiyev et al. Estimation of lost circulation rate using fuzzy clustering of geological objects by petrophysical properties
Kang et al. Classification of microseismic events and blasts using deep belief network
CN113312968B (zh) 一种监控视频中的真实异常检测方法
CN113326971A (zh) 一种基于PCA和Adaboost的隧道交通事故持续时间预测方法
Zhang et al. PCA-VGG16 model for classification of rock types
CN116204820B (zh) 一种基于稀有类挖掘的冲击危险性等级判别方法
CN118152896B (zh) 一种水平井钻头距砂岩储层纵向边界距离预测方法及装置
CN113095398B (zh) 一种基于遗传算法优化的bp神经网络的压裂数据清洗方法
Koduru Prediction Of Severity Of An Accident Based On Extent Of Injury Using Machine Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant