CN113202560A - 一种基于数据挖掘的煤矿风险预防和救援决策系统 - Google Patents

一种基于数据挖掘的煤矿风险预防和救援决策系统 Download PDF

Info

Publication number
CN113202560A
CN113202560A CN202110606893.4A CN202110606893A CN113202560A CN 113202560 A CN113202560 A CN 113202560A CN 202110606893 A CN202110606893 A CN 202110606893A CN 113202560 A CN113202560 A CN 113202560A
Authority
CN
China
Prior art keywords
rescue
data
decision
model
risk prevention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110606893.4A
Other languages
English (en)
Inventor
李冀
苏步宇
罗笑南
李芳�
吕智
张敏
蓝晓霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin Huigu Artificial Intelligence Industrial Technology Research Institute
Original Assignee
Guilin Huigu Artificial Intelligence Industrial Technology Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin Huigu Artificial Intelligence Industrial Technology Research Institute filed Critical Guilin Huigu Artificial Intelligence Industrial Technology Research Institute
Priority to CN202110606893.4A priority Critical patent/CN113202560A/zh
Publication of CN113202560A publication Critical patent/CN113202560A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • EFIXED CONSTRUCTIONS
    • E21EARTH DRILLING; MINING
    • E21FSAFETY DEVICES, TRANSPORT, FILLING-UP, RESCUE, VENTILATION, OR DRAINING IN OR OF MINES OR TUNNELS
    • E21F17/00Methods or devices for use in mines or tunnels, not covered elsewhere
    • E21F17/18Special adaptations of signalling or alarm devices
    • EFIXED CONSTRUCTIONS
    • E21EARTH DRILLING; MINING
    • E21FSAFETY DEVICES, TRANSPORT, FILLING-UP, RESCUE, VENTILATION, OR DRAINING IN OR OF MINES OR TUNNELS
    • E21F11/00Rescue devices or other safety devices, e.g. safety chambers or escape ways
    • EFIXED CONSTRUCTIONS
    • E21EARTH DRILLING; MINING
    • E21FSAFETY DEVICES, TRANSPORT, FILLING-UP, RESCUE, VENTILATION, OR DRAINING IN OR OF MINES OR TUNNELS
    • E21F17/00Methods or devices for use in mines or tunnels, not covered elsewhere
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Abstract

本发明提供一种基于数据挖掘的煤矿风险预防和救援决策的系统,将先进的数据挖掘技术应用于矿井中各种数据处理,然后采用SVM分类进行预测模型的构建,进而去预测风险,并采取相应措施去避险。救援决策方向采用预训练好的BERT中文模型,将各种成功的救援情况和方案去对BERT进行微调,然后根据情况给出措施。只要在训练模型时候有对应的事故数据,此发明可以针对各种风险去进行防护。相比于之前的单种煤矿风险预测系统,此系统能够对多种风险进行防护,而且加入了救援决策的功能使系统既能安全预防也可以成功的救援。

Description

一种基于数据挖掘的煤矿风险预防和救援决策系统
技术领域
本发明涉及一种基于数据挖掘的煤矿风险预防和救援决策系统,属于数据挖掘领域和煤矿安全领域。
背景技术
我国是一个资源比较丰富的地方,尤其是煤矿资源。相对于煤矿的其他地方,矿井内又是一个最为危险的地方,产生危险的因素主要有:瓦斯、顶板、运输、冲击地压、火灾、水害、机电等。煤矿事故对人民的生命和财产造成了严重的损失,我们可以发现在矿井中出现事故的因素有很多种,所以实时监测这些因素的一个数值,然后去进行预测可以让系统做出相应防护。
在现有的预防技术中,只能针对一个特定的事故去进行一个预测,现实中只做一种预防远远不能够满足人们的安全生产需求。随着科技发展引入智能高效的风险预防和应对已经发生危险正确处理救援决策的系统是必然趋势,也只有这样才可以保证高质量的生产。
发明内容
针对现有预防技术的不足,本发明的目的是提供一种基于数据挖掘的煤矿风险预防和救援决策的系统,将先进的数据挖掘技术应用于矿井中各种数据处理,然后采用SVM分类进行预测模型的构建,进而去预测风险,并做出相应预防来杜绝危险,救援决策方向采用预训练好的BERT中文模型,将各种成功的救援情况和方案去对BERT进行微调,然后根据情况给出措施。
实现本发明采用的技术方案是:本发明采用了Pearson积矩系数做相关性检测去除数据冗余,决策树特征提取和SVM分类模型的数据挖掘技术和分类算法手段去完成风险预防阶段的任务,然后针对发生的事故去使用微调好BERT模型,给出措施,具体按照下面步骤进行:
(1)风险防护模块:
第一步数据收集过程:在煤矿的生产中矿井中的各种属性值都量化成了数值属性,我们先将之前的所有这些数据都收集起来,为分析做准备。
第二步专家标注类标签:将收集到的数据给专家分析,让专家对这些数据进行分类,为了之后我们训练系统做准备。
第三步数据规范化过程:由于数值属性大小不一,会加重我们的分析负担。所以采用最小-最大规范化公式:
Figure BDA0003093369770000021
其中minA,maxA是属性A的最小值和最大值,把A值vi映射到区间[new_minA,new_maxA]中的vi'。
第四步相关性分析去冗余:对于数值属性,我们通过计算属性A和B的Pearson积矩系数公式:
Figure BDA0003093369770000022
其中n是元祖个数,ai和bi分别是元组在A和B上的值,
Figure BDA0003093369770000023
Figure BDA0003093369770000024
分别是A和B的均值,σA和σB分别是A和B的标准差。
第五步决策树进行特征选择:设置一个属性选择的最小阈值只要满足这个阈值就将这个属性保留。主要的选择指标有信息熵公式:
Figure BDA0003093369770000025
D表示当前的数据集合,k表示当前数据集合的第k类,也就是我们目标变量的类型。
将导致风险的属性进行保留,信息增益公式:Gain(D,A)=H(D)-H(D|A),其中
Figure BDA0003093369770000026
基于特征A数据集D的划分,H(D|A):表示基于特征A(分类后)的信息熵。Di:基于特征A对数据集D划分的子集。
Figure BDA0003093369770000027
考虑到特征分类子集的数据量不同,给每个子集赋予了权重。n:为特征A的分类总数,即有多少个Di。基于目标分类对特征类别Di数据集的划分:Dik:每个特征分类子集Di中目标分类后的子集。K:为目标分类的类别总数,即有多少个Dik
Figure BDA0003093369770000028
每个特征分类子集中,各目标分类子子集所占比例。
第六步避免连锁事故发生寻找各事故之间的频繁因素:将上一步选择出来导致事故发生的因素进行一个整合之后,开始挖掘这些事故的频繁因素,然后对于这些挖掘出来的频繁因素进行更加严格的监控,避免连锁事故的发生。在寻找频繁因素的时候主要使用的是Apriori先验算法,是通过计算A和B事件的支持度公式:support=P(A∪B),指事件A和B同时发生的概率,还有置信度
Figure BDA0003093369770000029
这2个公式完成挖掘。
第七步SVM训练模型:SVM支持向量机,主要针对小样本数据、非线性及高维模式识别中表现出许多特有的优势,而且有很好的泛化能力。所以我们此处采用SVM去训练此系统的分类器。此处主要是使用了高斯核函数公式:K(xi,xj)=exp(-γ||xi-xj||2)去进行一个高维的投影,然后在高维空间寻找到一个分割面,在映射到低维空间。
(2)救援决策模块:
第一步成功救援数据收集:将历史上各种救援成功的文档进行收集,其中内容要求要有各种现场情况和如何救援的方案。
第二步数据处理:将收集到的文档数据进行划分,主要就是将每一种现场情况和每一种救援进行摘取出来,放入表格里面不同的列,为下一步做准备。
第三步中文BERT模型微调:首先BERT是采用了transformer的encode部分去进行组合的一个自然语言处理深度学习模型。而transformer中最为重要的是self-attention机制,计算公式是:
Figure BDA0003093369770000031
其中Q,K,V是将输入的一个词向量通过矩阵变换成了3部分。然后再利用处理好的文字数据去微调预训练好的模型就可得到最终的模型。
第四步救援决策给出:使用者对系统述说现在情况,系统给出救援方案去帮助做出最优的救援方案。
本发明的有益效果是:
(1)传统的风险防护,仅仅能够针对一种风险去做预防,但是这个系统可以针对多种风险去进行防护,只要你有对应的数据去训练出每种风险对应SVM模型就可以去做防护。而且较之前仅有的风险预测,现在添加了救援决策模块以应对发生大的事故。
(2)将先进的数据挖掘技术应用于矿井中各种数据处理,然后采用SVM分类进行预测模型的构建,进而去预测风险,并做出相应预防杜绝危险,救援决策方向采用预训练好的BERT中文模型,将各种成功的救援情况和方案去对BERT进行微调,然后根据情况给出措施。
附图说明
图1是该系统软件的模块图。
图2是该系统软件的用例图。
图3是该系统进行风险预测的流程图。
图4是该系统进行决策的流程图。
具体实施方式
下面将结合本发明实施例中的附图,进行具体说明。
我们这个系统的模块图如图1所示,它主要是由三部分大模块组成,分别是:生成模型模块,风险预防模块,救援决策模块。其中生成模型模块的工作是生成一个预测模型去判断是否会有风险,在其中数据处理模块列举了三种风险,其实他可以适用各种风险只要有数据和类标签;风险预防模块的工作是获取实时数据,然后利用上一步获取的模型去做一个风险预测起到及时规避风险的作用;救援决策模块的工作是就是针对现场情况将如何进行救援的方案给出。然后分别展示了每个大模块下面的子模块,它们之间相互配合完成整个系统的工作。
如图2是此系统的一个用例图,就是展示了此系统的使用者分别去使用此系统的一个功能体现。简单而言此系统针对3部分人群,首先就是构建系统的技术人员,他首先根据每一部分的所要完成的工作去对系统进行一个构造,还负责系统在之后使用过程中的更新功能,以及使用者的一个权限管理,使得他们只能够完成属于自己的那一部分操作,以免因误操作使系统出现错误而导致发生事故;员工主要就是负责将系统的一个监测器去打开,让系统去实时的获取需要监控的数值,然后系统的风险防护功能去判别是否会有风险发生,进而去做一个及时的处理;领导主要就是使用系统的一个决策功能,也就是在发生事故之后,对系统述说现场情况,然后给出成功的救援方案。
如图3是此系统进行风险预防时的流程图,步骤分别是:
第一步数据收集过程:在煤矿的生产中矿井中的各种属性值都量化成了数值属性,我们先将之前的所有这些数据都收集起来,为分析做准备。
第二步专家标注类标签:将收集到的数据给专家分析,让专家对这些数据进行分类,为了之后我们训练系统做准备。
第三步数据规范化过程:由于数值属性大小不一,会加重我们的分析负担。所以采用最小-最大规范化公式:
Figure BDA0003093369770000041
其中minA,maxA是属性A的最小值和最大值,把A值vi映射到区间[new_minA,new_maxA]中的vi'。
第四步相关性分析去冗余:对于数值属性,我们通过计算属性A和B的Pearson积矩系数公式:
Figure BDA0003093369770000042
其中n是元祖个数,ai和bi分别是元组在A和B上的值,
Figure BDA0003093369770000043
Figure BDA0003093369770000044
分别是A和B的均值,σA和σB分别是A和B的标准差。
第五步决策树进行特征选择:设置一个属性,选择的最小阈值只要满足这个阈值就将这个属性保留。主要的选择指标有信息熵公式:
Figure BDA0003093369770000045
D表示当前的数据集合,k表示当前数据集合的第k类,也就是我们目标变量的类型。
将导致风险的属性进行保留,信息增益公式:Gain(D,A)=H(D)-H(D|A),其中
Figure BDA0003093369770000051
基于特征A数据集D的划分,H(D|A):表示基于特征A(分类后)的信息熵。Di:基于特征A对数据集D划分的子集。
Figure BDA0003093369770000052
考虑到特征分类子集的数据量不同,给每个子集赋予了权重。n:为特征A的分类总数,即有多少个Di。基于目标分类对特征类别Di数据集的划分:Dik:每个特征分类子集Di中目标分类后的子集。K:为目标分类的类别总数,即有多少个Dik
Figure BDA0003093369770000053
每个特征分类子集中,各目标分类子子集所占比例。
第六步避免连锁事故发生寻找各事故之间的频繁因素:将上一步选择出来导致事故发生的因素进行一个整合之后,开始挖掘这些事故的频繁因素,然后对于这些挖掘出来的频繁因素进行更加严格的监控,避免连锁事故的发生。在寻找频繁因素的时候主要使用的是Apriori算法,是通过计算A和B事件的支持度公式:sup port=P(A∪B),指事件A和B同时发生的概率,还有置信度
Figure BDA0003093369770000054
这2个公式完成挖掘。
第七步SVM训练模型:SVM支持向量机,主要针对小样本数据、非线性及高维模式识别中表现出许多特有的优势,而且有很好的泛化能力。所以我们此处采用SVM去训练此系统的分类器。此处主要是使用了高斯核函数公式:K(xi,xj)=exp(-γ||xi-xj||2)去进行一个高维的投影,然后在高维空间寻找到一个分割面,在映射到低维空间。
第八步传感器实时数据获取:根据第五步获取的属性进行一个实时的数据获取。
第九步训练好的模型实时监控:将第七步获取的数据传入系统中,然后SVM分类器去判断是否会有风险,然后起到杜绝风险的一个作用。
如图4是此系统进行救援决策时的流程图,步骤分别是:
第一步成功救援数据收集:将历史上各种救援成功的文档进行收集,其中内容要求要有各种现场情况和如何救援的方案。
第二步数据处理:将收集到的文档数据进行划分,主要就是将每一种现场情况和每一种救援进行摘取出来,放入表格里面不同的列,为下一步做准备。
第三步中文BERT模型微调:首先BERT是采用了transformer的encode部分去进行组合的一个自然语言处理深度学习模型。而transformer中最为重要的是self-attention机制,计算公式是:
Figure BDA0003093369770000061
其中Q,K,V是将输入的一个词向量通过矩阵变换成了3部分。然后再利用处理好的文字数据去微调预训练好的模型就可得到最终的模型。
第四步救援决策给出:使用者对系统述说现在情况,系统给出救援方案去帮助做出最优的救援方案。

Claims (4)

1.一种基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:生成模型模块,风险预防模块,救援决策模块。
2.根据权利要求1所述基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:风险预防的方法其中还包含了生成模型的过程按照下面步骤进行:
第一步数据收集过程:在煤矿的生产中矿井中的各种属性值都量化成了数值属性,我们先将之前的所有这些数据都收集起来,为分析做准备。
第二步专家标注类标签:将收集到的数据给专家分析,让专家对这些数据进行分类,为了之后我们训练系统做准备。
第三步数据规范化过程:由于数值属性大小不一,会加重我们的分析负担。所以采用最小-最大规范化公式:
Figure FDA0003093369760000011
其中minA,maxA是属性A的最小值和最大值,把A值vi映射到区间[new_minA,new_maxA]中的v′i
第四步相关性分析去冗余:对于数值属性,我们通过计算属性A和B的Pearson积矩系数公式:
Figure FDA0003093369760000012
其中n是元祖个数,ai和bi分别是元组在A和B上的值,
Figure FDA0003093369760000013
Figure FDA0003093369760000014
分别是A和B的均值,σA和σB分别是A和B的标准差。
第五步决策树进行特征选择:设置一个属性,选择的最小阈值只要满足这个阈值就将这个属性保留。主要的选择指标有信息熵公式:
Figure FDA0003093369760000015
D表示当前的数据集合,k表示当前数据集合的第k类,也就是我们目标变量的类型。
将导致风险的属性进行保留,信息增益公式:Gain(D,A)=H(D)-H(D|A),其中
Figure FDA0003093369760000016
基于特征A数据集D的划分,H(D|A):表示基于特征A(分类后)的信息熵。
第六步避免连锁事故发生寻找各事故之间的频繁因素:将上一步选择出来的导致事故发生的因素进行一个整合之后,开始挖掘这些事故的频繁因素,然后对于这些挖掘出来的频繁因素进行更加严格的监控,避免连锁事故的发生。在寻找频繁因素的时候主要使用的是Apriori算法,是通过计算A和B事件的支持度公式:support=P(A∪B),指事件A和B同时发生的概率,还有置信度
Figure FDA0003093369760000021
这2个公式完成挖掘。
第七步SVM训练模型:我们此处采用SVM去训练此系统的分类器。此处主要是使用了高斯核函数公式:K(xi,xj)=exp(-γ||xi-xj||2)去进行一个高维的投影,然后在高维空间寻找到一个分割面,在映射到低维空间。
第八步传感器实时数据获取:根据第五步获取的属性进行一个实时的数据获取。
第九步训练好的模型实时监控:将第七步获取的数据传入系统中,通过SVM分类器去判断是否会有风险,然后起到杜绝风险的一个作用。
3.根据权利要求1所述基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:救援决策的方法按照下面步骤进行:
第一步成功救援数据收集:将历史上各种救援成功的文档进行收集,其中内容要求有各种现场情况和如何救援的方案。
第二步数据处理:将收集到的文档数据进行划分,主要就是将每一种现场情况和每一种救援方案摘取出来,放入表格里面不同的列,为下一步做准备。
第三步中文BERT模型微调:首先BERT是采用了transformer的encode部分去进行组合的一个自然语言处理深度学习模型。而transformer中最为重要的是self-attention机制,计算公式是:
Figure FDA0003093369760000022
其中Q、K、V是将输入的一个词向量通过矩阵变换成了3部分。然后再利用处理好的文字数据去微调预训练好的模型就可得到最终的模型。
第四步救援决策给出:使用者对系统述说现在情况,系统给出救援方案去帮助做出最优的救援方案。
4.根据权利要求1所述基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:将风险预防和救援决策进行了一个结合,使系统的功能更加完善。
CN202110606893.4A 2021-06-01 2021-06-01 一种基于数据挖掘的煤矿风险预防和救援决策系统 Pending CN113202560A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110606893.4A CN113202560A (zh) 2021-06-01 2021-06-01 一种基于数据挖掘的煤矿风险预防和救援决策系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110606893.4A CN113202560A (zh) 2021-06-01 2021-06-01 一种基于数据挖掘的煤矿风险预防和救援决策系统

Publications (1)

Publication Number Publication Date
CN113202560A true CN113202560A (zh) 2021-08-03

Family

ID=77023860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110606893.4A Pending CN113202560A (zh) 2021-06-01 2021-06-01 一种基于数据挖掘的煤矿风险预防和救援决策系统

Country Status (1)

Country Link
CN (1) CN113202560A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102042030A (zh) * 2010-12-17 2011-05-04 华中科技大学 基于无线传感器网络的施工隧道安全防护方法及监控系统
CN103244188A (zh) * 2013-05-14 2013-08-14 太原科技大学 一种基于物联网技术的煤矿井下综合监控系统
CN108416530A (zh) * 2018-03-19 2018-08-17 辽宁工程技术大学 一种煤矿突发事件应急响应风险决策方法
CN109636055A (zh) * 2018-12-21 2019-04-16 中国安全生产科学研究院 一种非煤矿山安全生产风险预测预警平台
BR102019008102A2 (pt) * 2019-04-22 2020-10-27 Vale S.A método e sistema para computar índices de riscos de incidentes ferroviários
CA3094424A1 (en) * 2019-06-21 2020-12-21 China University Of Mining And Technology Safety monitoring and early-warning method for man-machine interaction behavior of underground conveyor belt operator

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102042030A (zh) * 2010-12-17 2011-05-04 华中科技大学 基于无线传感器网络的施工隧道安全防护方法及监控系统
CN103244188A (zh) * 2013-05-14 2013-08-14 太原科技大学 一种基于物联网技术的煤矿井下综合监控系统
CN108416530A (zh) * 2018-03-19 2018-08-17 辽宁工程技术大学 一种煤矿突发事件应急响应风险决策方法
CN109636055A (zh) * 2018-12-21 2019-04-16 中国安全生产科学研究院 一种非煤矿山安全生产风险预测预警平台
BR102019008102A2 (pt) * 2019-04-22 2020-10-27 Vale S.A método e sistema para computar índices de riscos de incidentes ferroviários
CA3094424A1 (en) * 2019-06-21 2020-12-21 China University Of Mining And Technology Safety monitoring and early-warning method for man-machine interaction behavior of underground conveyor belt operator

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谷月;杨力;: "基于熵值法和支持向量机的煤矿安全管理风险评价", 宿州学院学报, no. 03 *

Similar Documents

Publication Publication Date Title
CN111008669A (zh) 一种基于深度学习的重着陆预测方法
CN111325323B (zh) 一种融合全局信息和局部信息的输变电场景描述自动生成方法
CN104504400B (zh) 一种基于在线行为建模的驾驶员异常行为检测方法
CN102487293A (zh) 基于网控的卫星通信网异常检测方法
CN111598179B (zh) 电力监控系统用户异常行为分析方法、存储介质和设备
CN112686775A (zh) 基于孤立森林算法的电力网络攻击检测方法及系统
CN105893208A (zh) 基于隐半马尔可夫模型的云计算平台系统故障预测方法
CN104281525B (zh) 一种缺陷数据分析方法及利用其缩减软件测试项目的方法
CN111143840B (zh) 一种主机操作指令异常识别的方法及系统
CN108319518B (zh) 基于循环神经网络的文件碎片分类方法及装置
CN106446081B (zh) 基于变化一致性挖掘时序数据关联关系的方法
CN113518063A (zh) 基于数据增强和BiLSTM的网络入侵检测方法及系统
CN109977747A (zh) 一种综合时空特征的煤矸识别系统
CN112507077B (zh) 基于关系图注意力神经网络的事件时序关系识别方法
CN103268406A (zh) 一种基于煤矿安全培训游戏的数据挖掘系统及方法
CN114239574A (zh) 一种基于实体和关系联合学习的矿工违规行为知识抽取方法
WO2021128704A1 (zh) 一种基于分类效用的开集分类方法
CN112132321A (zh) 一种基于机器学习对森林火灾预测分析的方法
CN107357895A (zh) 一种基于词袋模型的文本表示的处理方法
CN112148997A (zh) 一种用于灾害事件检测的多模态对抗模型的训练方法和装置
CN113268370A (zh) 一种根因告警分析方法、系统、设备及存储介质
CN107423697B (zh) 基于非线性融合深度3d卷积描述子的行为识别方法
CN117115581A (zh) 一种基于多模态深度学习的智能误操作预警方法及系统
CN115659244A (zh) 故障预测方法、装置及存储介质
CN106644035B (zh) 一种基于时频变换特性的振动源识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination