CN116070725A - 一种基于逻辑回归的矿压危险性预测方法 - Google Patents

一种基于逻辑回归的矿压危险性预测方法 Download PDF

Info

Publication number
CN116070725A
CN116070725A CN202211043890.5A CN202211043890A CN116070725A CN 116070725 A CN116070725 A CN 116070725A CN 202211043890 A CN202211043890 A CN 202211043890A CN 116070725 A CN116070725 A CN 116070725A
Authority
CN
China
Prior art keywords
data
pressure
mining
logistic regression
risk prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211043890.5A
Other languages
English (en)
Inventor
王蕊
陈绍杰
付冠群
石永奎
田刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202211043890.5A priority Critical patent/CN116070725A/zh
Publication of CN116070725A publication Critical patent/CN116070725A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于逻辑回归的矿压危险性预测方法,属于数据挖掘技术领域。该发明首先获取矿压数据库中的数据,对其预处理并进行分析提取出影响矿压危险性的主要特征;然后根据提取的特征建立矿压危险性预测模型,使用矿压数据训练预测模型;最后将评估好的模型应用于新矿压数据的危险性预测。基于逻辑回归建立的矿压危险性预测模型,可以提前预测矿压是否超过标准存在危险,进而有效地避免了矿山开采过程中的安全事故。同时逻辑回归算法具有训练速度快、准确率较高的特点,保证矿压危险性预测方法及时准确地进行预测,为矿山工作人员的决策提供一种可靠的方法。同时该专利将逻辑回归算法应用于实际的矿压检测项目,使用C#语言编写的预警界面,方便采矿作业管理者及时、准确、方便地看到预警结果,及时做出正确的生产决策。具体流程如摘要附图所示。

Description

一种基于逻辑回归的矿压危险性预测方法
技术领域
本发明属于数据挖掘技术领域,特别是矿压危险性的数据挖掘领域,涉及一种基于逻辑回归的矿压危险性预测方法。
背景技术
地下煤层开采以后,围岩的原始平衡状态受到破坏,引起了岩体内应力的重新分布。在重新分布过程中,围岩就要产生运动,导致围岩发生变形、破坏、甚至跨落,从而对采矿的工作面、巷道及周围的岩石产生压力,而所谓的矿压即矿山压力,就是指人们在开采过程中引起的岩移运动对支架周围岩石产生的作用力。
在我国近几年的矿山开采中,发生了大量的塌方事件,其中53%的事故原因在于工作人员没有对矿山压力进行及时的观测与处理,导致施工人员在后续作业中,破坏了岩体的应力平衡引发了安全事故。因此,对矿山压力危险性进行预测有着极其重要的作用。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于逻辑回归的矿压危险性预测方法,利用逻辑回归模型,包括以下步骤:
步骤一、获取矿压数据库中的数据;
步骤二、对获取的数据进行预处理;
步骤三、对预处理的数据进行特征提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据;
步骤四、根据矿压标准对每条数据打标签;
步骤五、将数据分为样本数据和待测数据;
步骤六、基于逻辑回归建立矿压危险性预测模型;
步骤七、使用矿压危险性预测模型,对矿压数据库中新的矿压数据进行预测。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明所述方法的流程示意图;
图2为本发明所述方法的正常预警界面示意图;
图3为本发明所述方法的异常预警界面示意图。
具体实施方式
下面结合附图和具体实施方式对本发明的内容做进一步详细说明。
逻辑回归(Logistic Regression,LR)是一种广义的线性回归分析模型,同时是一种统计分析工具,能对因变量和自变量进行回归建模,它建立在Sigmoid函数和自变量的线性回归模型之上,模型简单、训练速度快,且对于输出变量有很好的概率解释。本发明就是基于此提出的。
请参照图1所示,一种基于逻辑回归的矿压危险性预测方法包含以下详细步骤:
步骤一、获取矿压数据库中的数据,相关数据包含:
(1)工作面基本信息,包含:工作面名称、煤层厚度、采煤高度、放煤高度、工作面长度、推进方向长度、倾角、开切眼宽度、工作面已推进距离、采高、工作面平均埋深、相邻工作面老顶初次来压步距、相邻工作面老顶周期来压步距、老顶初次来压步距、老顶周期来压步距、支承压力超前影响范围、相邻工作面动载系数;
(2)支架相关信息,包含:支架数量、支架宽度、支架长度、支架型式、支架支柱数量、支架设计工作阻力、支架设计支护强度;
(3)测量数据,包含:数据采集时间、传感器编号、传感器测量矿压值;
上述的影响因素及解释如表1所示。
表1影响因素及解释
上述采集的数据来源于实际的项目,该项目为了实时监测某矿的矿压数据,建立了矿压监测管理信息系统,目的是为矿井管理者提供决策依据。
其中,工作面基本信息是工作人员根据工作面的实际情况测量和计算后,将数值输入矿压监测系统;液压支架均匀安装在矿井下,作用是支撑上部岩石或放顶煤,工作人员将它们的信息手动输入矿压监测系统;传感器安装在液压支架上,实时测量该液压支架的压力数值,每隔一段时间将该处监测的矿压数据输入数据库,并在监测系统中显示。本专利的数据直接从矿压监测系统的数据库中获取。
步骤二、对获取的数据进行预处理;步骤二中对数据进行与处理包括:
(1)异常值处理:如由于外界因素导致液压支架发生不正确的形变,进而造成记录的数据极大或者出现负值的情况,此时需要去该条数据。
(2)缺失值处理:如由于停电或者采煤作业停止等原因,传感器和矿监测系统被关闭,造成关闭时间的采集数据缺失,此时需要该掉这条数据。
(3)重复值删除:如由于系统原因造成一条数据出现很多遍,此时需要删除重复数据,只保留一条数据。
(4)定性变量转化为数值型变量:如该矿使用的液压支架有三种形式,分别会对矿压产生不同影响,需要将该变量使用数值表示。0表示支撑式支架、1表示掩护式支架、2表示支撑掩护式支架。
(5)日期由文本格式转换为时间格式:矿压检测数据库中保存的时间为字符串string类型,由于从传感器中收集的数据为时序数据,需要考虑时间的影响,所以将字符串类型的时间转换成时间datetime类型,方便对时序数据的计算。
一般地,将数据预处理的代码抽象出来封装成函数,方便在系统中调用。经过步骤二处理后的数据共1248条,分别来自23104工作面、23201工作面、23202工作面、23203工作面和23301工作面5个工作面。其中23104工作面有20条数据、23201工作面有20数据、23202工作面有47数据、23203工作面有1140数据、23301工作面有20数据。
步骤三、对预处理的数据进行特征提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据。步骤三提取到的特征有煤层厚度、采煤高度、工作面长度、煤层倾角、工作面平均埋深、老顶初次来压步距、老顶周期来压步距和支架设计工作阻力。
步骤四、根据矿压标准对每条数据打标签;步骤四中打标签的方法为:根据矿压标准规定,对传感器监测到的矿压数据进行分析。矿压数值超过标准存在危险的标签为1,矿压数值未超过标准不存在危险的标签为0。
步骤五、将数据分为样本数据和待测数据,其中样本数据用于训练逻辑回归模型,待测数据用于评估训练好的模型的拟合效果。在步骤一数据库收集的数据中,选取1000条数据作为样本数据,剩下的248条数据为待测数据。
步骤六、基于逻辑回归建立矿压危险性预测模型,建立的方法为,在线性回归基础上通过Sigmoid函数将结果映射到(0,1)之间,从而得到计算矿压是否存在危险的概率的逻辑回归模型;
线性回归函数如公式(1)所示:
z=ωTX+b=ω1x12x2+...+ωixi+b   (1)
其中,该函数为逻辑回归模型的输入数据。xi表示特征向量,即数据库中收集到的影响矿压危险性因素,如煤层厚度、采煤高度、煤层倾角等;ωi表示对应的特征权重向量。根据步骤三的特征提取可知,提取特征的数量为8个,因此此处i的值为8。
由于线性回归的输出结果是实数域中连续的,但是矿压危险性的结果为0或1,不是连续的值,因此引入sigmoid函数作为激活函数,对应的逻辑回归数学模型如公式(2)所示:
在该激活函数中,当z趋近于正无穷大时,h(z)的值趋近于1;当z趋近于负无穷大时,h(z)趋近于0。自变量取值为任意实数,函数值域为[0,1]。经过sigmoid函数,将任意的输入映射到[0,1]区间内,从而在线性回归z中得到一个预测值,再将该值映射到sigmoid函数中,从而完成由值到概率的转换。一般情况下,我们判定当hω(x)≥0.5时,预测y=1,表示矿压数值超过标准存在危险;当hω(x)≤0.5时,预测y=0,表示矿压数值未超过标准不存在危险。
y=1的概率值即为逻辑回归的假设函数hω(x),即矿压数值超过标准存在危险的概率,如公式(3)所示:
P(y=1|x;ω)=hω(x)   (3)
y=0的概率值即为1-hω(x),即矿压数值未超过标准不存在危险的概率,如公式(4)所示:
P(y=0|x;ω)=1-hω(x)   (4)
将上述假设函数概率进行整合,可以得出如公式(5)所示:
P(y|x;ω)=[hω(x)]y·[1-hω(x)]1-y   (5)
在逻辑回归中,训练集由m组标记过的样本构成:
{(X(1),Y(1)),(X(2),Y(2)),...,(X(m),Y(m))}   (6)
输入特征为X(m),特征向量X的维度为n,n的取值为影响矿压危险性因素的个数;逻辑回归是处理二分类问题,类标签为Y(m)∈{0,1},即矿压数值是否超过标准存在危险的输出结果,所以模型函数如公式(7)所示:
其中,i表示特征向量的数量,i=1,2,…,n,j表示样本数量,即获取的矿压样本数据的数量,j=1,2,…,m,由于数据库收集的样本数据为1000条,因此m的数值为1000。
由于每个样本最后得出的危险性概率值都是独立的,因此,对于所有样本来说,可以得到对应的最大似然函数如公式(8)所示:
最终求解最大似然函数,即所有样本数据最终求得的概率越大越好。为了方便计算,对上述似然函数取对数,取对数不会影响原函数的单调性,但是会放大函数值之间的差异,从而可以更好地区分各个样本的类别。取对数的结果如公式(9)所示:
取对数后,得到的新函数是一个上凸函数,使用梯度上升来求得最大似然函数值,或将上述函数乘以-1,变成最小化负对数似然函数,该函数为下凸函数,可以使用梯度下降法来对其进行求解。最小化负对数似然函数对m个样本取平均即得到损失函数。损失函数可以理解为,将影响矿压危险性特征的数值代入预测模型后,预测模型的输出矿压危险性结果和真实结果之间的差值。损失函数如公式(10)所示:
为了提高矿压危险性预测结果的准确性,需要使模型的输出结果和真实结果之间的差值越小越好,即损失函数越小越好。本专利采用批梯度下降法来求解方程组的参数值,批梯度下降法ω的更新公式如如公式(11)所示:
其中,:=表示变量值更新符号,目的是根据影响矿压危险性特征的梯度,每次迭代不断改变对应特征对矿压危险性的影响权重,最终找到每个影响特征的最优权重ω;表示损失函数J(ω)对ω求偏导,过程如下:
所以批梯度下降ω的更新公式如公式(12)所示:
其中,i=1,2,…,8,j=1,2,…,1000;α是学习率,为了保证模型的训练效果,当使用批梯度下降算法训练模型时,采用Adagrad优化算法(自适应梯度算法)进行算法优化,根据训练的程度自适应地调整学习率,越接近最小值时学习率越小,防止学习率过大导致损失函数无法逼近最小值或学习率过小导致训练收敛过慢。Adagrad优化算法的核心思想就是,如果一个参数的梯度一直都非常大,那么其对应的学习率就变小一点,防止震荡;如果一个参数的梯度一直都非常小,那么这个参数的学习率就变大一点,使得其能够更快地更新。Adagrad优化算法公式如公式(13)所示:
其中,t表示计算梯度的轮数;α表示学习率;Gt,j表示从第一轮到第t轮梯度的平方和;∈表示平滑项,用于避免分母为0的情况,通常取10的负10次方;i表示第t轮计算第i个特征的梯度。
将待测数据输入训练后的模型进行评估,通过评估的逻辑回归模型即为训练好的逻辑回归模型。
步骤七、将步骤一至步骤六所述的过程使用c#编程语言装成LRWarning类,其中,LRW arning类包含的主要成员函数如表2所示。
表2LRWarning类的主要成员函数
将LRWarning类在矿压监测系统中调用,输入的数据为采矿作业进行中传感器实时收集的矿压数据,使用类中Output函数评估好的逻辑回归预测模型对实时监测数据进行预测,输出的结果为0或1。
为方便采矿作业管理者及时、准确、方便地看到预警结果,本专利使用C#编写一个界面来显示预警结果。界面实时显示每个液压支架的编号、位置及传感器读取的矿压数据和时间,当传感器记录新的矿压数据传入数据库,LRWarning类读取数据并对该数据进行预测。若预警结果返回0,界面上该液压支架信息显示为安全的绿色,表示采矿作业区域矿压值安全,不存在危险,如图2所示;若预警结果返回1,界面上该液压支架变为醒目的红色,如图3所示,此时红色的出现给采矿作业管理者发出了一个危险性信号,管理者追本溯源找到该液压支架所在的矿区位置,对其进行分析判断并及时做出正确的生产决策。

Claims (4)

1.一种基于逻辑回归的矿压危险性预测方法,其特征在于,包括以下步骤:
步骤一、获取矿压数据库中的数据;
步骤二、对获取的数据进行预处理;步骤二中对数据进行与处理包括:
异常值处理、缺失值处理、重复值删除、定性变量转化为数值型变量以及日期由文本格式转换为时间格式;
步骤三、对预处理的数据进行特征提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据;
步骤四、根据矿压标准对每条数据打标签;步骤四中打标签的方法为:矿压数值超过标准存在危险的标签为1,矿压数值未超过标准不存在危险的标签为0;
步骤五、将数据分为样本数据和待测数据;
步骤六、基于逻辑回归建立矿压危险性预测模型,步骤六包含以下子步骤:
(1)基于逻辑回归建立矿压危险性预测模型,求解模型的最大似然函数;
(2)对最大似然函数求导获得损失函数;
(3)将样本数据输入构建的模型,并使用梯度下降法求解损失函数对回归模型进行训练;
(4)将待测数据输入训练后的模型进行评估,通过评估的逻辑回归模型即为训练好的逻辑回归模型;
步骤七、使用矿压危险性预测模型,对矿压数据库中新的矿压数据进行预测。
2.根据权利要求1所述的基于逻辑回归的矿压危险性预测方法,其特征在于,步骤一中的数据来源于实际项目的矿压数据库。
3.根据权利要求1所述的基于逻辑回归的矿压危险性预测方法,其特征在于,使用梯度下降法求解损失函数对回归模型进行训练,其中使用Adagrad算法优化学习率。
4.根据权利要求1所述的基于逻辑回归的矿压危险性预测方法,其特征在于,该专利将逻辑回归算法应用于实际的矿压检测项目,同时使用C#语言编写的预警界面,方便采矿作业管理者及时、准确、方便地看到预警结果,及时做出正确的生产决策。
CN202211043890.5A 2022-08-29 2022-08-29 一种基于逻辑回归的矿压危险性预测方法 Pending CN116070725A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211043890.5A CN116070725A (zh) 2022-08-29 2022-08-29 一种基于逻辑回归的矿压危险性预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211043890.5A CN116070725A (zh) 2022-08-29 2022-08-29 一种基于逻辑回归的矿压危险性预测方法

Publications (1)

Publication Number Publication Date
CN116070725A true CN116070725A (zh) 2023-05-05

Family

ID=86175756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211043890.5A Pending CN116070725A (zh) 2022-08-29 2022-08-29 一种基于逻辑回归的矿压危险性预测方法

Country Status (1)

Country Link
CN (1) CN116070725A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116882755A (zh) * 2023-07-28 2023-10-13 鱼快创领智能科技(南京)有限公司 一种基于车载Tbox数据预测货车运输路线偷油风险的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103244179A (zh) * 2013-04-28 2013-08-14 中国矿业大学 一种预测煤矿井下冲击矿压危险的评估方法
CN108492049A (zh) * 2018-04-04 2018-09-04 冯世程 一种基于逻辑回归的p2p平台运营风险评估的系统
CN112418738A (zh) * 2020-12-17 2021-02-26 泸州银行股份有限公司 一种基于逻辑回归的员工操作风险预测方法
CN114386429A (zh) * 2021-12-22 2022-04-22 应急管理部信息研究院 基于语义识别的煤矿灾害风险预测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103244179A (zh) * 2013-04-28 2013-08-14 中国矿业大学 一种预测煤矿井下冲击矿压危险的评估方法
CN108492049A (zh) * 2018-04-04 2018-09-04 冯世程 一种基于逻辑回归的p2p平台运营风险评估的系统
CN112418738A (zh) * 2020-12-17 2021-02-26 泸州银行股份有限公司 一种基于逻辑回归的员工操作风险预测方法
CN114386429A (zh) * 2021-12-22 2022-04-22 应急管理部信息研究院 基于语义识别的煤矿灾害风险预测方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116882755A (zh) * 2023-07-28 2023-10-13 鱼快创领智能科技(南京)有限公司 一种基于车载Tbox数据预测货车运输路线偷油风险的方法

Similar Documents

Publication Publication Date Title
CN108460144B (zh) 一种基于机器学习的煤炭设备故障预警系统及方法
CN107194068B (zh) 页岩气压裂过程井下异常工况实时预测预警方法及装置
CN106296435B (zh) 一种矿井瓦斯监测异常数据识别方法
CN108922123B (zh) 一种矿山边坡滑移稳定性监测预警方法
CN114118224B (zh) 一种基于神经网络的全系统遥测参数异常检测系统
Leng et al. A hybrid data mining method for tunnel engineering based on real-time monitoring data from tunnel boring machines
CN110121053B (zh) 一种钻井现场风险分级预警的视频监控方法
CN115186917A (zh) 一种主动预警式风险管控系统及方法
CN115638833B (zh) 一种监控数据处理方法及系统
CN111980736B (zh) 一种矿山锚杆支护巷道的危险度预测与冒顶预警方法
US20220027230A1 (en) Predicting Equipment Fail Mode from Process Trace
CN116070725A (zh) 一种基于逻辑回归的矿压危险性预测方法
RU2745136C1 (ru) Автоматизированная система выявления и прогнозирования осложнений в процессе строительства нефтяных и газовых скважин
CN116384112A (zh) 一种用于矿山灾害模拟和预警的方法及系统
CN116777085B (zh) 基于数据分析和机器学习技术的煤矿水害预测系统
CN112668749B (zh) 一种基于类标加权极限学习机的煤矿瓦斯预警方法
CN106246226A (zh) 一种矿井瓦斯涌出异常的识别方法
CN116579601B (zh) 矿山安全生产风险监测预警系统及方法
CN108549967B (zh) 盾构机刀盘性能健康评估方法与系统
CN109555561B (zh) 一种矿压预测预报方法及其系统
CN113392576B (zh) 一种系留气球主缆绳拉力状态评估预警方法
CN113685166A (zh) 一种钻井事故预警方法及系统
CN117489413B (zh) 一种煤层瓦斯涌出异常超前探测与预警方法
CN117780446B (zh) 针对煤矿支护的安全性能监测方法及系统
CN116740819B (zh) 基于ai算法的施工现场中施工异常行为的识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination