CN116611004A - 煤矿安全灾害预测模型训练方法、预警方法、预警系统 - Google Patents

煤矿安全灾害预测模型训练方法、预警方法、预警系统 Download PDF

Info

Publication number
CN116611004A
CN116611004A CN202310889843.0A CN202310889843A CN116611004A CN 116611004 A CN116611004 A CN 116611004A CN 202310889843 A CN202310889843 A CN 202310889843A CN 116611004 A CN116611004 A CN 116611004A
Authority
CN
China
Prior art keywords
data
prediction model
coal mine
disaster prediction
mine safety
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310889843.0A
Other languages
English (en)
Other versions
CN116611004B (zh
Inventor
李爽
贺超
李琦琦
韩世锋
黄晨晨
虎东成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Zhong Kuang An Hua Technology Development Co ltd
Original Assignee
Jiangsu Zhong Kuang An Hua Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Zhong Kuang An Hua Technology Development Co ltd filed Critical Jiangsu Zhong Kuang An Hua Technology Development Co ltd
Priority to CN202310889843.0A priority Critical patent/CN116611004B/zh
Publication of CN116611004A publication Critical patent/CN116611004A/zh
Application granted granted Critical
Publication of CN116611004B publication Critical patent/CN116611004B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D21/00Measuring or testing not otherwise provided for
    • G01D21/02Measuring two or more variables by means not covered by a single other subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mining & Mineral Resources (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种煤矿安全灾害预测模型训练方法、预警方法、预警系统。所述方法通过将柯西变异算子引入到蚁狮算法中,利用蚁狮算法的局部搜索能力和全局搜索能力相结合,从而实现更快的收敛速度和更高的搜索精度。同时,引入柯西变异算子能够对算法进行自适应不同的搜索空间和搜索目标;该算法能够在全局探索能力和收敛速度之间取得平衡。同时,这种算法能够有效地避免算法陷入局部最优解,并且具有较强的鲁棒性。基于柯西变异的蚁狮算法在处理高维度问题和非线性问题时,较强的适应性和鲁棒性。

Description

煤矿安全灾害预测模型训练方法、预警方法、预警系统
技术领域
本申请涉及煤矿安全监测技术领域,特别是涉及一种煤矿安全灾害预测模型训练方法、预警方法、预警系统。
背景技术
煤矿安全监测对于煤矿生产十分重要,主要实现对煤矿灾害的预警,为煤矿安全生产提供支撑。目前的灾害预警方式有:第一种、凭借过往经验设置一个范围,当安全系统的监测值超限后就认为是异常;第二种、基于传统机器学习训练的预测模型。
但是,针对上述第一种灾害预警方式,其凭借经验设置超限范围,阈值范围设置不合理导致误报漏报影响生产,凭借少数人的经验给出的范围,缺少科学性和普适性。针对上述第二种灾害预警方式,其采用传统机器学习训练的模型,因为样本本较少,模型精度低,提前感知生产安全情况不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高模型准确率、减少误报漏报、提升工作效率的煤矿安全灾害预测模型训练方法、预警方法、预警系统。
一方面,提供一种煤矿安全灾害预测模型训练方法,所述方法包括:
获取煤矿安全的历史监测数据并进行数据预处理形成样本集合;
将所述样本集合拆分成训练集、验证集、测试集,并输入至灾害预测模型中;
所述灾害预测模型采用支持向量机算法,根据所述样本集合生成对应所述灾害预测模型的衍生变量,运用嵌入法选择部分衍生变量作为用于训练所述灾害预测模型的目标特征;
根据所述训练集对所述灾害预测模型进行训练直至收敛,将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,将目标特征代入所述灾害预测模型中并利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支持向量机算法的惩罚系数和核函数参数进行优化;
获取优化后支撑向量机算法的惩罚系数和核函数参数的最优值,并通过所述验证集和所述测试集进行验证,验证合格后输出建立的煤矿安全灾害预测模型。
进一步的,所述获取煤矿安全的历史监测数据并进行数据预处理形成样本集合步骤包括:
获取煤矿安全的历史监测数据;
对获取的历史监测数据进行数据预处理,进行异常数据识别与修复,形成规范化的监测数据;
匹配对应传感器、设备信息后形成样本集合。
进一步的,所述对获取的历史监测数据进行数据预处理步骤中,进行异常数据识别与修复包括:
根据预置规则设置数据离散阈值范围;
当监测数据中数据超出数据离散阈值范围时,去除对应的监测数据;
当监测数据为空值时,计算对应数据的平均值,采用平均值补充空值。
进一步的,所述对获取的历史监测数据进行数据预处理步骤中,进行异常数据识别与修复之前还包括:
对异常数据进行数据还原,根据异常数据的记录信息追溯历史数据,按照时序顺序筛选出符合预设条件的数据,根据数据采集频率、存储规则将筛选出的数据转换为异常数据集。
进一步的,所述根据所述样本集合生成对应所述灾害预测模型的衍生变量步骤包括:
获取所述样本集合中的监测数据,并按照数据类别分类为多种基础特征;
使用函数变换法利用差分公式X=Xi-Xi-1,将当前基础特征观测值Xi减去上一时刻的基础特征观测值Xi-1得到差分结果X;
将差分结果X形成对应基础特征的衍生变量。
进一步的,所述运用嵌入法选择部分衍生变量作为用于训练所述灾害预测模型的目标特征步骤包括:
使用支撑向量机算法进行训练得到每个衍生变量的权值系数;
根据权值系数从大到小的顺序对衍生变量进行排序;
选取权值系数大于第一阈值的衍生变量作为用于训练所述灾害预测模型的目标特征;所选取的目标特征包括瓦斯含量、风速及矿山地质灾害数据中的至少一种。
进一步的,所述将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,将目标特征代入所述灾害预测模型中并利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支撑向量机算法进行优化步骤包括:
随机生成预设数量的蚂蚁和蚁狮,并初始化蚂蚁和蚁狮的位置和速度;
根据当前位置将目标特征代入所述灾害预测模型中计算每个蚂蚁和蚁狮的适应度函数值;
使用柯西变异算法对每个蚂蚁和蚁狮的位置和速度进行变异;
根据柯西变异后的新位置和速度,更新每个蚂蚁和蚁狮的位置和速度;
根据新的位置和速度,将目标特征代入所述灾害预测模型中重新计算每个蚂蚁和蚁狮的适应度函数值;
记录所有蚂蚁和蚁狮的最优解,并更新全局最优解;
重复返回使用柯西变异算法对每个蚂蚁和蚁狮的位置和速度进行变异步骤并执行多次,直至达到预设精度阈值后停止。
另一方面,提供了一种煤矿安全灾害预警方法,其特征在于,包括:
根据前文所述的煤矿安全灾害预测模型训练方法训练形成煤矿安全灾害预警模型;
利用训练的煤矿安全灾害预警模型对实时监测数据进行分析,计算出预测值,结合灾害评判规则,输出判断结果。
再一方面,提供了一种煤矿安全灾害预警系统,包括:
数据源模块,用于收集煤矿安全的监测数据;所述监测数据包括顶板压力测试数据、矿压监测数据、环境监测数据、水文监测数据;
数据采集模块,用于获取煤矿安全的监测数据;
数据存储模块,用于存储煤矿安全的监测数据;
处理引擎模块,用于对数据进行格式转换、清洗处理以及进行数据计算;
分析建模模块,包括数据处理单元、特征工程单元、模型评估单元;
所述数据处理单元用于获取煤矿安全的历史监测数据并进行数据预处理形成样本集合,将所述样本集合拆分成训练集、验证集、测试集,并输入至灾害预测模型中;根据所述样本集合生成对应所述灾害预测模型的衍生变量,运用嵌入法选择部分衍生变量作为所述灾害预测模型的目标特征;
所述特征工程单元用于根据所述训练集对所述灾害预测模型进行训练直至收敛,将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支撑向量机算法进行优化;
所述模型评估单元用于获取优化后的灾害预测模型的支撑向量机算法的惩罚系数和核函数参数的最优值,并通过所述验证集和所述测试集进行验证,验证合格后输出训练的煤矿安全灾害预警模型。
进一步的,所述数据源模块包括PLC分站、顶板压力测试单元、矿压监测单元、环境监测单元、水文监测单元;
所述数据采集模块包括PLC数据采集单元、PLC数据解析单元、基础数据采集单元;
所述数据存储模块包括时序数据库、分布式文件系统、关系型数据库、基于内存存储的非关系型数据库;
所述处理引擎模块包括流式处理引擎、批处理引擎、SQL编译器。
上述煤矿安全灾害预测模型训练方法、预警方法、预警系统,通过将柯西变异算子引入到蚁狮算法中,利用蚁狮算法的局部搜索能力和全局搜索能力相结合,从而实现更快的收敛速度和更高的搜索精度。同时,引入柯西变异算子能够对算法进行自适应不同的搜索空间和搜索目标;该算法能够在全局探索能力和收敛速度之间取得平衡。同时,这种算法能够有效地避免算法陷入局部最优解,并且具有较强的鲁棒性。基于柯西变异的蚁狮算法在处理高维度问题和非线性问题时,较强的适应性和鲁棒性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中煤矿安全灾害预警系统的结构框图;
图2为一个实施例中的数据流转流程示意图;
图3为一个实施例中煤矿安全灾害预测模型训练方法的流程示意图;
图4为一个实施例中在所述煤矿安全灾害预测模型在灾害预警的过程中的流程示意图;
图5为另一个实施例中煤矿安全灾害预测模型训练方法的流程示意图;
图6为一个实施例中获取煤矿安全的历史监测数据并进行数据预处理形成样本集合步骤的流程示意图;
图7为一个实施例中根据所述样本集合生成对应所述灾害预测模型的衍生变量步骤的流程示意图;
图8为一个实施例中运用嵌入法选择部分衍生变量作为用于训练所述灾害预测模型的目标特征步骤的流程示意图;
图9为一个实施例中将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,将目标特征代入所述灾害预测模型中并利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支撑向量机算法进行优化步骤的流程示意图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例1
本申请建立在海量数据的基础上,利用时序数据的异常检测算法结合机器学习,同时利用CALO(基于柯西变异的蚁狮算法)对支持向量机算法(SVM)进行优化,提高模型的准度度和精确度,实现对灾害的预警。
如图1所示,提供了一种煤矿安全灾害预警系统。本系统主要包括数据源模块,数据采集模块、数据存储模块、处理引擎模块、分析建模模块和应用模块。
煤矿安全灾害预警系统的主要功能:
数据源模块支持多类PLC设备的接入;
数据采集模块支持实时PLC数据的采集、解析;支持基础数据的批量导入;
数据存储模块支持海量数据存储,包括时序数据库IotDB、分布式文件系统HDFS、关系型数据库MySQL、基于内存存储的非关系型数据库Gemfire;
处理引擎模块支持多种模式,包括基于Flink的流式处理引擎、基于FlinkSQL的批处理引擎、基于Presto的SQL编译器;
分析建模模块支持数据预处理、特征工程、模型评估;
应用模块支持模型管理、趋势分析、灾害预警、系统管理。
其中PLC指可编程逻辑控制器。
如图1所示,数据采集模块采集数据源各类数据,经过转换加载到数据存储模块中,通过数据处理引擎完成数据处理、建模等,通过应用系统展示各业务模块的分析结果。
如图2所示,举例说明数据流转流程,数据采集模块实时采集数据源模块各PLC分站数据,经过解析、转换,调用数据处理引擎Flink完成数据处理,将数据存入时序数据库IotDB中。
如图3所示,提供了一种煤矿安全灾害预测模型训练方法,图3即展示了建模流程。
首先,对历史数据进行数据预处理,包括异常值去除、空值补充,对数据进行规范化处理;进行异常数据识别与修复前,需要对异常数据进行数据还原,根据异常数据记录信息(位置、发生时间、传感器编号、设备编号)追溯历史数据,按照条件从时序数据库中筛选出符合条件的数据,后根据数据采集频率、存储规则对数据进行转换,结合主数据匹配对应传感器、设备信息最终形成样本集合。
其中异常值去除是根据预置规则进行,如识别温度大于50℃的数据为异常值。空值补充为利用当前计算维度的均值补充。如:瓦斯含量这一特征中出现的空值,则用样本集中所有瓦斯含量值计算出的均值补充进去。
可理解是,在进行异常数据识别与修复前,进行异常数据的记录信息(位置、发生时间、传感器编号、设备编号)追溯历史数据,能够知道对应发生异常的位置、发生时间、传感器编号、设备编号信息,从而找出在异常数据对应发生的位置区域和时间段,收集在异常数据对应发生的位置区域和时间段对应的所有其他监测数据,共同作为异常数据集。
其次,拆分样本集合,将大规模样本集合拆分成训练了训练集、验证集、测试集,数据分配比例为98:1:1。
再者,进行样本集合的特征处理,特征处理是将原始数据进行数据变换,以便能更好的预测结果,主要包括特征构造、特征选择。
特征构造主要是产生衍生变量,生成对灾害预测模型有利的变量;本方案使用函数变换法,利用差分公式X=Xi-Xi-1,将当前基础特征观测值Xi减去上一时刻的基础特征观测值Xi-1得到差分结果X;其中Xi为现在观测值,Xi-1为上一时刻观测值,X为计算结果;以瓦斯含量这一特征为基础转换成新特征,具体方法:用当前瓦斯含量减去上一时刻的瓦斯含量值得到差分结果;利用差分变化可以消除数据对时间的依赖性,也就是降低时间对数据的影响。
特征选择:特征选择,主要运用嵌入法(使用方法:先使用SVM算法进行训练,得到各个特征的权值系数,根据系数从大到小选择特征),选择出对模型训练有意义的的特征,本方法选取的特征主要有瓦斯含量、风速及矿山地质灾害数据等。
所述矿山地质灾害数据包括地下水位、水量、冲击地压。其中地下水位、水量属于水文数据。水文数据主要涉及与水文环境相关的信息,包括地下水位、地下水流动方向和速度、地下水化学成分、水质、水量等。水文数据是研究水文循环和水资源管理的重要依据,对于了解地下水的分布和特征、水文过程以及水资源的合理利用具有重要意义。水文数据通常由水文观测站点采集,并经过处理和分析得到。冲击地压是指在煤矿开采过程中,由于煤层变形和矿山压力释放等原因导致的地压突变现象。它是一种矿山地质灾害,对矿井和矿工的安全造成威胁。冲击地压的发生与煤层的岩性、厚度、倾角、构造等地质因素密切相关,但它更多地被归类为矿山地质工程数据或矿山地质灾害数据,而不是传统意义上的地质数据。
最后,进行模型训练,针对如何预警煤矿灾害出现的情况,使用一种基于柯西变异的蚁狮算法优化SVM的煤矿安全灾害预测模型。
将自适应T分布的柯西变异以算子的形式融入到蚁狮优化算法中,解决蚁狮优化算法易陷入局部最优停滞,收敛精度低及收敛速度较慢等问题,利用基于柯西变异的蚁狮算法对SVM的参数C、g进行优化,优化后避免模型出现拟合现象,同时提高训练速度。
T分布(t-distribution)是一种概率分布。柯西变异是指基于柯西分布进行的随机数生成和随机采样的一种方法。柯西分布又称为洛伦兹分布,是指在某个位置做出观测时,观测值为特定值的概率。
蚁狮算法是一种启发式算法,是基于蚁群优化和模拟蚁狮捕食过程的思想发展而来的。
SVM:中文名称支撑向量机,英文全程为Support Vector Machine,是一种监督学习算法,它被广泛应用于分类和回归问题。SVM的基本思想是通过构建一个最优超平面,将数据分为不同的类别。
C和g是SVM中非常重要的参数,其中 C是惩罚系数,即对误差的宽容度。c越高,说明越不能容忍出现误差,容易过拟合。C越小,容易欠拟合。C过大或过小,泛化能力变差。 g是核函数参数,决定了数据映射到新的特征空间后的分布,g越大,支持向量越少,g值越小,支持向量越多。支持向量的个数影响训练与预测的速度。
同等条件下测试,本申请建立的煤矿安全灾害预测模型与通用网格搜索优化算法相比,模型训练速度快,精度高,对比结果如表1所示。
表1
本申请建立煤矿安全灾害预测模型的算法核心思想为:通过将柯西变异算子引入到蚁狮算法中,利用蚁狮算法的局部搜索能力和全局搜索能力相结合,从而实现更快的收敛速度和更高的搜索精度。同时,引入柯西变异算子能够对算法进行自适应不同的搜索空间和搜索目标;该算法能够在全局探索能力和收敛速度之间取得平衡。同时,这种算法能够有效地避免算法陷入局部最优解,并且具有较强的鲁棒性。基于柯西变异的蚁狮算法在处理高维度问题和非线性问题时,较强的适应性和鲁棒性。
通过将柯西变异算子引入到蚁狮算法的步骤为:
1. 初始化蚁群和蚁狮:随机生成一定数量的蚂蚁和蚁狮,并初始化它们的位置和速度。
2. 计算适应度函数值:根据当前位置计算每个蚂蚁和蚁狮的适应度函数值,该值描述了解决问题的优良程度。
3. 柯西变异:对于每个蚂蚁和蚁狮,使用柯西变异算法对其位置和速度进行变异。
4. 更新位置和速度:根据柯西变异后的新位置和速度,更新每个蚂蚁和蚁狮的位置和速度。
5. 更新适应度函数值:根据新的位置和速度,重新计算每个蚂蚁和蚁狮的适应度函数值。
6. 更新最优解:记录所有蚂蚁和蚁狮的最优解,并更新全局最优解。
7. 重复执行:重复执行步骤3-6,直到达到预设的停止条件(如:达到最大迭代次数100次或达到某个精度要求精度95%)。
8. 得出惩罚参数C和核函数参数g的最优值后,进行模型的验证。
9. 输出煤矿安全灾害预测模型。
如图4所示,在所述煤矿安全灾害预测模型应用时,在灾害预警的过程中,利用建立的模型对实时数据进行分析,计算出预测值,结合灾害评判规则,给出最终的判断结果。
综上所述,本实施例以大数据技术为基础的数据收集、存储、解析方式,可快速完成海量数据的处理及样本集合的迭代更新,以上述模型训练方式,解决了模型训练时间长,容易出现拟合问题,提高了模型的迭代速度;辅以云边协同为基础的模型应用方式,实现模型的快速部署应用;与传统方案预测结果较差、数据处理周期长、模型训练慢相比,本方案在复杂多变的场景下,有较快的响应速度及较好的准确率。
实施例2
在实施例2中,包含了实施例1的全部技术特征。参考图3,如图5所示,在实施例2中提供了一种煤矿安全灾害预测模型训练方法,包括以下步骤:
步骤S1,获取煤矿安全的历史监测数据并进行数据预处理形成样本集合;
步骤S2,将所述样本集合拆分成训练集、验证集、测试集,并输入至灾害预测模型中;
步骤S3,所述灾害预测模型采用支持向量机算法,根据所述样本集合生成对应所述灾害预测模型的衍生变量,运用嵌入法选择部分衍生变量作为用于训练所述灾害预测模型的目标特征;
步骤S4,根据所述训练集对所述灾害预测模型进行训练直至收敛,将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,将目标特征代入所述灾害预测模型中并利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支持向量机算法的惩罚系数和核函数参数进行优化;
步骤S5,获取优化后支撑向量机算法的惩罚系数和核函数参数的最优值,并通过所述验证集和所述测试集进行验证,验证合格后输出建立的煤矿安全灾害预测模型。
其中,所述将所述样本集合拆分成训练集、验证集、测试集时,训练集、验证集、测试集的分配比例为98:1:1。
如图6所示,所述获取煤矿安全的历史监测数据并进行数据预处理形成样本集合步骤包括:
步骤S11,获取煤矿安全的历史监测数据;
步骤S12,对获取的历史监测数据进行数据预处理,进行异常数据识别与修复,形成规范化的监测数据;
步骤S13,匹配对应传感器、设备信息后形成样本集合。
进一步的,所述对获取的历史监测数据进行数据预处理步骤中,进行异常数据识别与修复包括:
根据预置规则设置数据离散阈值范围;
当监测数据中数据超出数据离散阈值范围时,去除对应的监测数据;
当监测数据为空值时,计算对应数据的平均值,采用平均值补充空值。
进一步的,所述对获取的历史监测数据进行数据预处理步骤中,进行异常数据识别与修复之前还包括:
对异常数据进行数据还原,根据异常数据的记录信息(位置、发生时间、传感器编号、设备编号)追溯历史数据,按照时序顺序筛选出符合预设条件的数据,根据数据采集频率、存储规则将筛选出的数据转换为异常数据集。
可理解是,在进行异常数据识别与修复前,进行异常数据的记录信息(位置、发生时间、传感器编号、设备编号)追溯历史数据,能够知道对应发生异常的位置、发生时间、传感器编号、设备编号信息,从而找出在异常数据对应发生的位置区域和时间段,收集在异常数据对应发生的位置区域和时间段对应的所有其他监测数据,共同作为异常数据集。
如图7所示,所述根据所述样本集合生成对应所述灾害预测模型的衍生变量步骤包括:
步骤S21,获取所述样本集合中的监测数据,并按照数据类别分类为多种基础特征;
步骤S22,使用函数变换法利用差分公式X=Xi-Xi-1,将当前基础特征观测值Xi减去上一时刻的基础特征观测值Xi-1得到差分结果X;
步骤S23,将差分结果X形成对应基础特征的衍生变量。
如图8所示,所述运用嵌入法选择部分衍生变量作为用于训练所述灾害预测模型的目标特征步骤包括:
步骤S31,使用支撑向量机算法进行训练得到每个衍生变量的权值系数;
步骤S32,根据权值系数从大到小的顺序对衍生变量进行排序;
步骤S33,选取权值系数大于第一阈值的衍生变量作为用于训练所述灾害预测模型的目标特征;所选取的目标特征包括瓦斯含量、风速及矿山地质灾害数据中的至少一种。
如图9所示,所述将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,将目标特征代入所述灾害预测模型中并利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支撑向量机算法进行优化步骤包括:
步骤S41,随机生成预设数量的蚂蚁和蚁狮,并初始化蚂蚁和蚁狮的位置和速度;
步骤S42,根据当前位置将目标特征代入所述灾害预测模型中计算每个蚂蚁和蚁狮的适应度函数值;
步骤S43,使用柯西变异算法对每个蚂蚁和蚁狮的位置和速度进行变异;
步骤S44,根据柯西变异后的新位置和速度,更新每个蚂蚁和蚁狮的位置和速度;
步骤S45,根据新的位置和速度,将目标特征代入所述灾害预测模型中重新计算每个蚂蚁和蚁狮的适应度函数值;
步骤S46,记录所有蚂蚁和蚁狮的最优解,并更新全局最优解;
步骤S47,重复返回使用柯西变异算法对每个蚂蚁和蚁狮的位置和速度进行变异步骤并执行多次,即重复执行步骤S43-S46,直至达到预设精度阈值后停止。
另一方面,参阅图4,提供了一种煤矿安全灾害预警方法,其特征在于,包括:
根据前文所述的煤矿安全灾害预测模型训练方法训练形成煤矿安全灾害预警模型训练形成煤矿安全灾害预警模型;
利用训练的煤矿安全灾害预警模型对实时监测数据进行分析,计算出预测值,结合灾害评判规则,输出判断结果。
再一方面,参阅图1,提供了一种煤矿安全灾害预警系统,包括:
数据源模块,用于收集煤矿安全的监测数据;所述监测数据包括顶板压力测试数据、矿压监测数据、环境监测数据、水文监测数据;
数据采集模块,用于获取煤矿安全的监测数据;
数据存储模块,用于存储煤矿安全的监测数据;
处理引擎模块,用于对数据进行格式转换、清洗处理以及进行数据计算;
分析建模模块,包括数据处理单元、特征工程单元、模型评估单元;
所述数据处理单元用于获取煤矿安全的历史监测数据并进行数据预处理形成样本集合,将所述样本集合拆分成训练集、验证集、测试集,并输入至灾害预测模型中;根据所述样本集合生成对应所述灾害预测模型的衍生变量,运用嵌入法选择部分衍生变量作为所述灾害预测模型的目标特征;
所述特征工程单元用于根据所述训练集对所述灾害预测模型进行训练直至收敛,将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支撑向量机算法进行优化;
所述模型评估单元用于获取优化后的灾害预测模型的支撑向量机算法的惩罚系数和核函数参数的最优值,并通过所述验证集和所述测试集进行验证,验证合格后输出训练的煤矿安全灾害预警模型。
进一步的,所述数据源模块包括PLC分站、顶板压力测试单元、矿压监测单元、环境监测单元、水文监测单元;
所述数据采集模块包括PLC数据采集单元、PLC数据解析单元、基础数据采集单元;
所述数据存储模块包括时序数据库(IotDB)、分布式文件系统(HDFS)、关系型数据库(MySQL)、基于内存存储的非关系型数据库(Gemfire);
所述处理引擎模块包括流式处理引擎、批处理引擎、SQL编译器。
进一步的,所述煤矿安全灾害预警系统还包括应用模块,所述应用模块包括灾害预警单元、模型管理单元、趋势分析单元、系统管理单元。
上述煤矿安全灾害预测模型训练方法、预警方法、预警系统,通过将柯西变异算子引入到蚁狮算法中,利用蚁狮算法的局部搜索能力和全局搜索能力相结合,从而实现更快的收敛速度和更高的搜索精度。同时,引入柯西变异算子能够对算法进行自适应不同的搜索空间和搜索目标;该算法能够在全局探索能力和收敛速度之间取得平衡。同时,这种算法能够有效地避免算法陷入局部最优解,并且具有较强的鲁棒性。基于柯西变异的蚁狮算法在处理高维度问题和非线性问题时,较强的适应性和鲁棒性。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现所述煤矿安全灾害预测模型训练方法的步骤,或者处理器执行计算机程序时实现所述煤矿安全灾害预警方法的步骤。
该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储实现所述煤矿安全灾害预测模型训练方法的步骤数据,或者存储实现所述煤矿安全灾害预警方法的步骤数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现所述煤矿安全灾害预测模型训练方法的步骤,或者处理器执行计算机程序时实现所述煤矿安全灾害预警方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种煤矿安全灾害预测模型训练方法,其特征在于,包括:
获取煤矿安全的历史监测数据并进行数据预处理形成样本集合;
将所述样本集合拆分成训练集、验证集、测试集,并输入至灾害预测模型中;
所述灾害预测模型采用支持向量机算法,根据所述样本集合生成对应所述灾害预测模型的衍生变量,运用嵌入法选择部分衍生变量作为用于训练所述灾害预测模型的目标特征;
根据所述训练集对所述灾害预测模型进行训练直至收敛,将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,将目标特征代入所述灾害预测模型中并利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支持向量机算法的惩罚系数和核函数参数进行优化;
获取优化后支撑向量机算法的惩罚系数和核函数参数的最优值,并通过所述验证集和所述测试集进行验证,验证合格后输出建立的煤矿安全灾害预测模型。
2.根据权利要求1所述的煤矿安全灾害预测模型训练方法,其特征在于,所述获取煤矿安全的历史监测数据并进行数据预处理形成样本集合步骤包括:
获取煤矿安全的历史监测数据;
对获取的历史监测数据进行数据预处理,进行异常数据识别与修复,形成规范化的监测数据;
匹配对应传感器、设备信息后形成样本集合。
3.根据权利要求2所述的煤矿安全灾害预测模型训练方法,其特征在于,所述对获取的历史监测数据进行数据预处理步骤中,进行异常数据识别与修复包括:
根据预置规则设置数据离散阈值范围;
当监测数据中数据超出数据离散阈值范围时,去除对应的监测数据;
当监测数据为空值时,计算对应数据的平均值,采用平均值补充空值。
4.根据权利要求3所述的煤矿安全灾害预测模型训练方法,其特征在于,所述对获取的历史监测数据进行数据预处理步骤中,进行异常数据识别与修复之前还包括:
对异常数据进行数据还原,根据异常数据的记录信息追溯历史数据,按照时序顺序筛选出符合预设条件的数据,根据数据采集频率、存储规则将筛选出的数据转换为异常数据集。
5.根据权利要求1所述的煤矿安全灾害预测模型训练方法,其特征在于,所述根据所述样本集合生成对应所述灾害预测模型的衍生变量步骤包括:
获取所述样本集合中的监测数据,并按照数据类别分类为多种基础特征;
使用函数变换法利用差分公式X=Xi-Xi-1,将当前基础特征观测值Xi减去上一时刻的基础特征观测值Xi-1得到差分结果X;
将差分结果X形成对应基础特征的衍生变量。
6.根据权利要求5所述的煤矿安全灾害预测模型训练方法,其特征在于,所述运用嵌入法选择部分衍生变量作为用于训练所述灾害预测模型的目标特征步骤包括:
使用支撑向量机算法进行训练得到每个衍生变量的权值系数;
根据权值系数从大到小的顺序对衍生变量进行排序;
选取权值系数大于第一阈值的衍生变量作为用于训练所述灾害预测模型的目标特征;所选取的目标特征包括瓦斯含量、风速及矿山地质灾害数据中的至少一种。
7.根据权利要求1所述的煤矿安全灾害预测模型训练方法,其特征在于,所述将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,将目标特征代入所述灾害预测模型中并利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支撑向量机算法进行优化步骤包括:
随机生成预设数量的蚂蚁和蚁狮,并初始化蚂蚁和蚁狮的位置和速度;
根据当前位置将目标特征代入所述灾害预测模型中计算每个蚂蚁和蚁狮的适应度函数值;
使用柯西变异算法对每个蚂蚁和蚁狮的位置和速度进行变异;
根据柯西变异后的新位置和速度,更新每个蚂蚁和蚁狮的位置和速度;
根据新的位置和速度,将目标特征代入所述灾害预测模型中重新计算每个蚂蚁和蚁狮的适应度函数值;
记录所有蚂蚁和蚁狮的最优解,并更新全局最优解;
重复返回使用柯西变异算法对每个蚂蚁和蚁狮的位置和速度进行变异步骤并执行多次,直至达到预设精度阈值后停止。
8.一种煤矿安全灾害预警方法,其特征在于,包括:
根据权利要求1至7任意一项所述的煤矿安全灾害预测模型训练方法训练形成煤矿安全灾害预警模型;
利用训练的煤矿安全灾害预警模型对实时监测数据进行分析,计算出预测值,结合灾害评判规则,输出判断结果。
9.一种煤矿安全灾害预警系统,其特征在于,包括:
数据源模块,用于收集煤矿安全的监测数据;所述监测数据包括顶板压力测试数据、矿压监测数据、环境监测数据、水文监测数据;
数据采集模块,用于获取煤矿安全的监测数据;
数据存储模块,用于存储煤矿安全的监测数据;
处理引擎模块,用于对数据进行格式转换、清洗处理以及进行数据计算;
分析建模模块,包括数据处理单元、特征工程单元、模型评估单元;
所述数据处理单元用于获取煤矿安全的历史监测数据并进行数据预处理形成样本集合,将所述样本集合拆分成训练集、验证集、测试集,并输入至灾害预测模型中;根据所述样本集合生成对应所述灾害预测模型的衍生变量,运用嵌入法选择部分衍生变量作为所述灾害预测模型的目标特征;
所述特征工程单元用于根据所述训练集对所述灾害预测模型进行训练直至收敛,将自适应t分布的柯西变异以算子的形式融入到蚁狮优化算法中形成基于柯西变异的蚁狮算法,利用所述基于柯西变异的蚁狮算法对所述灾害预测模型的支撑向量机算法进行优化;
所述模型评估单元用于获取优化后的灾害预测模型的支撑向量机算法的惩罚系数和核函数参数的最优值,并通过所述验证集和所述测试集进行验证,验证合格后输出训练的煤矿安全灾害预警模型。
10.根据权利要求9所述的煤矿安全灾害预警系统,其特征在于,
所述数据源模块包括PLC分站、顶板压力测试单元、矿压监测单元、环境监测单元、水文监测单元;
所述数据采集模块包括PLC数据采集单元、PLC数据解析单元、基础数据采集单元;
所述数据存储模块包括时序数据库、分布式文件系统、关系型数据库、基于内存存储的非关系型数据库;
所述处理引擎模块包括流式处理引擎、批处理引擎、SQL编译器。
CN202310889843.0A 2023-07-20 2023-07-20 煤矿安全灾害预测模型训练方法、预警方法、预警系统 Active CN116611004B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310889843.0A CN116611004B (zh) 2023-07-20 2023-07-20 煤矿安全灾害预测模型训练方法、预警方法、预警系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310889843.0A CN116611004B (zh) 2023-07-20 2023-07-20 煤矿安全灾害预测模型训练方法、预警方法、预警系统

Publications (2)

Publication Number Publication Date
CN116611004A true CN116611004A (zh) 2023-08-18
CN116611004B CN116611004B (zh) 2023-11-10

Family

ID=87680396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310889843.0A Active CN116611004B (zh) 2023-07-20 2023-07-20 煤矿安全灾害预测模型训练方法、预警方法、预警系统

Country Status (1)

Country Link
CN (1) CN116611004B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117454323A (zh) * 2023-11-14 2024-01-26 中国矿业大学(北京) 一种基于gpr-issa-cnn的煤自燃温度预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109767036A (zh) * 2018-12-28 2019-05-17 北京航空航天大学 基于自适应蚁狮优化的支持向量机故障预测方法
CN111985678A (zh) * 2020-07-06 2020-11-24 上海交通大学 一种光伏功率短期预测方法
CN115526422A (zh) * 2022-10-19 2022-12-27 中国矿业大学 一种煤矿瓦斯爆炸风险预测方法
CN115951254A (zh) * 2022-12-15 2023-04-11 东南大学 一种锂离子电池健康状态及剩余使用寿命预估方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109767036A (zh) * 2018-12-28 2019-05-17 北京航空航天大学 基于自适应蚁狮优化的支持向量机故障预测方法
CN111985678A (zh) * 2020-07-06 2020-11-24 上海交通大学 一种光伏功率短期预测方法
CN115526422A (zh) * 2022-10-19 2022-12-27 中国矿业大学 一种煤矿瓦斯爆炸风险预测方法
CN115951254A (zh) * 2022-12-15 2023-04-11 东南大学 一种锂离子电池健康状态及剩余使用寿命预估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李丁炜: "物联网环境下的煤矿瓦斯安全风险评估及管控研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》, no. 8 *
王宏力 等: "《惯性测量组合智能故障诊断及预测技术》", 国防工业出版社, pages: 59 - 61 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117454323A (zh) * 2023-11-14 2024-01-26 中国矿业大学(北京) 一种基于gpr-issa-cnn的煤自燃温度预测方法

Also Published As

Publication number Publication date
CN116611004B (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN115578015B (zh) 基于物联网的污水处理全过程监管方法、系统及存储介质
CN113298297B (zh) 一种基于孤立森林与wgan网络的风电输出功率预测方法
CN112529341B (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
CN112528365B (zh) 一种地下基础设施结构健康演化趋势预测方法
CN111199346B (zh) 综合管廊监理方法、装置、计算机设备以及存储介质
CN111259947A (zh) 一种基于多模态学习的电力系统故障预警方法和系统
CN112508053A (zh) 基于集成学习框架的智能诊断方法、装置、设备及介质
CN116611004B (zh) 煤矿安全灾害预测模型训练方法、预警方法、预警系统
CN116341901B (zh) 一种滑坡面域-单体危险性预警的一体化评价方法
CN116882790B (zh) 一种矿山生态修复区域的碳排放设备管理方法及系统
CN115438897A (zh) 一种基于blstm神经网络的工业过程产品质量预测方法
Qiu et al. Analysis and prediction of rockburst intensity using improved DS evidence theory based on multiple machine learning algorithms
CN111340975A (zh) 异常数据特征提取方法、装置、设备及存储介质
Giglioni et al. Deep autoencoders for unsupervised damage detection with application to the Z24 benchmark bridge
Bond et al. A hybrid learning approach to prognostics and health management applied to military ground vehicles using time-series and maintenance event data
CN111026790A (zh) 一种基于数据挖掘的结构安全评估及预报方法
CN116883755B (zh) 一种乡村建设环境监测方法、系统、设备及存储介质
Zhang et al. Ultra Short Term Power Forecasting of Wind Generation Based on Improved LSTM
CN118247108B (zh) 一种基于数据库技术的区域地震安评方法及系统
Zhou Application of data mining in coal mine safety decision system based on rough set
CN116523467A (zh) 一种基于云计算的刀具管理系统及其方法
CN118462313A (zh) 基于大数据技术的瓦斯浓度超限预警方法及智能分析设备
CN118570011A (zh) 一种联合自编码器和最优运输的煤矿支护参数预测方法
Xiao et al. Autoencoder‐based method to assess bridge health monitoring data quality
Zhang et al. Fault Diagnosis and Localization of Transmission Lines Based on R-Net Algorithm Optimized by Feature Pyramid Network.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant