CN116204820A - 一种基于稀有类挖掘的冲击危险性等级判别方法 - Google Patents

一种基于稀有类挖掘的冲击危险性等级判别方法 Download PDF

Info

Publication number
CN116204820A
CN116204820A CN202310442993.7A CN202310442993A CN116204820A CN 116204820 A CN116204820 A CN 116204820A CN 202310442993 A CN202310442993 A CN 202310442993A CN 116204820 A CN116204820 A CN 116204820A
Authority
CN
China
Prior art keywords
data
impact risk
mining
risk level
impact
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310442993.7A
Other languages
English (en)
Other versions
CN116204820B (zh
Inventor
王蕊
陈绍杰
赵同彬
田刚
李学龙
尹大伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202310442993.7A priority Critical patent/CN116204820B/zh
Publication of CN116204820A publication Critical patent/CN116204820A/zh
Application granted granted Critical
Publication of CN116204820B publication Critical patent/CN116204820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种基于稀有类挖掘的冲击危险性等级判别方法,涉及矿业和信息技术领域。本发明先对采动数据向量化处理,将采动数据分组后提取特征参数得到特征向量后,基于稀有类型数据挖掘算法对整体数据集进行稀有类型检测,获取各种子数据的冲击危险性等级形成训练集,再基于深度学习方法构建冲击危险性等级检测模型,训练冲击危险性等级检测模型挖掘数据并自动生成标记冲击危险性等级标签,形成冲击危险性数据集,再利用文本分类算法构建冲击危险性等级判别模型,利用冲击危险性数据集训练冲击危险性等级判别模型后,采用训练后的冲击危险性等级判别模型判别采动数据的冲击危险性等级,实现了冲击危险性等级的准确判别,有利于冲击危险的预警。

Description

一种基于稀有类挖掘的冲击危险性等级判别方法
技术领域
本发明涉及矿业和信息技术领域,具体涉及一种基于稀有类挖掘的冲击危险性等级判别方法。
背景技术
随着煤炭资源开采深度和开采强度的增加,矿井冲击地压等动力灾害日益加剧,严重威胁煤矿开采的安全。冲击地压作为煤炭资源开采必须解决的重大安全生产难题,国内外学者关于矿井冲击地压进行了大量研究。根据煤矿生产实践中的冲击防治情况,冲击地压的防治主要在于对冲击地压进行早期的冲击危险性监测分析与预测。然而,在冲击地压危险状态判别过程中会出现多种复杂现象,监测数据同包括地质条件、开采技术条件在内的各种信息相互交织,既存在重复又存在相互矛盾,这就使得如何综合利用各参量信息,统一各参量指标中的异常指数,实现对预测结论的一致性描述,已成为当前冲击地压预测的重要课题。
目前,在冲击危险性预警和预测的理论和技术方面已经形成了许多重要成果,也积累了丰富的经验,但在冲击危险性评价理论和方法上仍存在一些关键性的问题亟待解决。尚未建立用于准确评价和预测冲击危险性的方法,尤其是在评价指标、危险判据以及预测模型的有效性和普适性方面还有大量的工作需要深入研究。提高冲击危险性预测水平需要在理论分析、经验类比等方法的基础上,综合采用多种手段进行联合监测,通过研究各种监测信息与冲击地压孕育各阶段之间的关系以及联合监测信息的时空变化规律,建立冲击危险性等级判别指标与模型。
然而,随着采场环境的复杂性和采动大数据的日益增多,冲击危险性等级的判定难度剧增。虽然利用被标记的采动数据集作为机器学习方法的训练集,可以构建判别冲击危险性等级的模型。但是,由于采场正常运行过程中,采场状态一般比较稳定,发生冲击危险性的概率比较低,异常数据在整体的采动数据集合中占比很少,导致难以获取被标记的异常采动训练集。因此,如何有效地从整体采动数据集中提取冲击危险性异常数据已成为目前煤矿安全预警方法中较为欠缺且迫切的诉求。
发明内容
为了解决上述问题,本发明提出了一种基于稀有类挖掘的冲击危险性等级判别方法,该方法利用深度学习方法构建的冲击危险性等级检测模型挖掘获取冲击危险性数据集,结合基于文本分类算法TextCNN所构建的冲击危险性等级判别模型进行冲击危险性等级判别,实现了对冲击危险性等级的准确判别,有利于预测冲击地压事故的发生,为保障矿井的高效安全开采提供了技术支持。
本发明为了实现上述目的,采用如下技术方案:
一种基于稀有类挖掘的冲击危险性等级判别方法,其特征在于,包括如下步骤:
步骤1,获取采场运行过程的采动数据,对采动数据进行向量化处理,通过对采动数据分组得到多个采动数据记录序列,提取各采动数据记录序列中的特征参数,构建特征向量;
步骤2,利用特征向量生成整体数据集,基于具有先验知识的稀有类型数据挖掘算法CLOVER对整体数据集进行稀有类型检测,获取各种子数据的冲击危险性等级,并利用带有冲击危险性等级标签的种子数据作为训练数据,形成训练集;
步骤3,基于深度学习方法构建冲击危险性等级检测模型,利用训练集训练冲击危险性等级检测模型挖掘训练数据学习生成冲击危险性等级标签,并将冲击危险性等级标签标记在所输入的种子数据上,得到被标记有冲击危险性等级标签的冲击危险性数据,形成冲击危险性数据集;
步骤4,基于文本分类算法TextCNN构建冲击危险性等级判别模型,用于判别采动数据的冲击危险性等级,将稀有类型挖掘得到的冲击危险性数据集中的冲击危险性数据作为训练数据,对冲击危险性等级判别模型进行训练,利用训练后的冲击危险性等级判别模型判别新采集采动数据的冲击危险性等级。
优选地,所述步骤1中,具体包括以下步骤:
步骤1.1,获取采场运行过程的采动数据,设置时间窗的时长,基于时间窗对采动数据进行分组,将采动数据划分为多个采动数据记录序列;
所述采动数据用于反映采场运行过程中的地质信息、采掘信息、围岩动态监测信息和支护工况信息,采动数据包括多个指标参数值,所述指标参数包括煤层厚度、煤层倾角、支架型式、支护阻力、微震能量、钻孔应力、老顶初次来压步距和老顶周期来压步距;
步骤1.2,分别针对各采动数据记录序列,将采动数据记录序列内的各指标参数值统一至同一时间点处,得到处理后的采动数据记录序列;
步骤1.3,根据处理后的各采动数据记录序列,获取各指标参数值在所有处理后采动数据记录序列中出现的频率,确定各指标参数用于向量化的权重因子,如公式(1)所示:
Figure SMS_1
(1)
式中,idf(·)为指标参数用于向量化的权重因子,e为指标参数值,T为采动数据记录序列的总数,num为指标值在所有采动数据记录序列中出现的频次;
步骤1.4,根据各指标参数的权重因子,人工选取指标参数作为特征参数,根据所选特征参数的数量确定特征向量的维度,构建特征向量,特征向量中各维度内的各特征值,如公式(2)所示:
Figure SMS_2
(2)
式中,weight为特征值;l为用于表示指标参数是否被选取为特征参数的系数,l取值为0或1,当l=0时,表示指标参数被选取为特征参数,当l=1时,表示指标参数未被选取为特征参数;norm(·)为标准化函数;m为用于表示指标参数是否被格外关注,m取值为0或1,当m=0时,表示指标参数被格外关注,当m=1时,表示指标参数未被格外关注。
优选地,所述步骤2中,具体包括以下步骤:
步骤2.1,根据特征向量中各维度内的各特征值构建整体数据集,设置稀有类型检测的检测次数和标签数量,构建整体数据集的K近邻图;
步骤2.2,基于具有先验知识的稀有类型数据挖掘算法CLOVER对整体数据集进行稀有类型检测;
确定K近邻图中各数据点的局部变更度值,在K近邻图中选取局部变更度值最大的数据点作为最大局部变更度数据记录DlvdMax,判断最大局部变更度数据记录DlvdMax是否与冲击危险性相关,若最大局部变更度数据记录DlvdMax与冲击危险性相关,则将最大局部变更度数据记录DlvdMax作为用于异常数据挖掘的种子数据,若最大局部变更度数据记录DlvdMax与冲击危险性无关,则忽略最大局部变更度数据记录DlvdMax
步骤2.3,根据K近邻图中各数据点的连接关系,利用最大局部变更度数据记录DlvdMax的所有相邻数据点构建数据记录集E,将数据记录集E中所有数据点的局部变更度值均设置为-1;
步骤2.4,对数据记录集E中所有数据点人工设置冲击危险性等级标签,获取当前的人工贴标量,若当前的人工贴标量未达到预设的标签数量,则返回步骤2.2中,继续对整体数据集进行稀有类型检测,否则,则进入步骤2.5中;
步骤2.5,结束对整体数据集的稀有类型检测,将稀有类型检测所获取的带有冲击危险性等级标签的种子数据作为训练数据,形成用于深度学习的训练集。
优选地,所述K近邻图中数据点的局部变更度值计算公式为:
Figure SMS_3
(3)
其中,
Figure SMS_4
(4)
Figure SMS_5
(5)
式中,
Figure SMS_7
为数据点的局部变更度值,/>
Figure SMS_9
为数据点的变更值,/>
Figure SMS_10
为数据点的孤立值,/>
Figure SMS_12
、/>
Figure SMS_14
均为K近邻图中数据点的名称,/>
Figure SMS_15
为稀有类型检测的检测次数,/>
Figure SMS_16
为数据点的相邻数据点所构成的近邻集合,/>
Figure SMS_6
为最小距离求取函数,/>
Figure SMS_8
为数据点的/>
Figure SMS_11
个相邻数据点所构成的集合,/>
Figure SMS_13
为数据点距离第/>
Figure SMS_17
个相邻数据点的距离,/>
Figure SMS_18
为整体数据集,/>
Figure SMS_19
为最大距离求取函数。
优选地,所述步骤3中,具体包括以下步骤:
步骤3.1,基于TextCNN分类算法构建用于冲击危险性数据挖掘的冲击危险性等级检测模型,所述冲击危险性等级检测模型包括输入层、卷积层和输出层;
步骤3.2,利用训练集中的训练数据训练冲击危险性等级检测模型;
将训练集中的N个训练数据依次输入至冲击危险性等级检测模型的输入层中,所述输入层分别获取各训练数据中的种子数据和冲击危险性等级标签,并将训练数据输入至卷积层中;
所述卷积层具有非线性映射的能力,用于卷积处理提取训练数据中的有利信息,各训练数据经过卷积层处理后得到卷积映射结果,将各训练数据的卷积映射结果作为迭代优化函数的学习特征,对迭代优化函数进行优化,并利用迭代优化函数进行聚类并生成冲击危险性等级标签,预测得到种子数据的冲击危险性等级标签并标记在种子数据上,通过所述输出层输出预测的冲击危险性等级标签;
步骤3.3,确定训练后的冲击危险性等级检测模型,利用训练后的冲击危险性等级检测模型挖掘剩余数据用于为采场数据标记冲击危险性数据,得到被标记有冲击危险性等级标签的冲击危险性数据,形成冲击危险性数据集。
优选地,所述步骤3中,冲击危险性等级检测模型的迭代优化函数为:
Figure SMS_20
(6)
式中,
Figure SMS_22
为训练数据的序号,/>
Figure SMS_23
为第/>
Figure SMS_25
个训练数据中的种子数据,/>
Figure SMS_27
为第/>
Figure SMS_29
个训练数据的冲击危险性等级标签,/>
Figure SMS_31
为稀有类型检测的类别数,/>
Figure SMS_33
为种子数据的卷积映射结果,/>
Figure SMS_21
为学习矩阵,学习矩阵/>
Figure SMS_24
的尺寸为/>
Figure SMS_26
,/>
Figure SMS_28
为各批次输入的数据个数;/>
Figure SMS_30
为训练数据的总数,/>
Figure SMS_32
为实数集;
所述冲击危险性等级检测模型中设置损失函数为:
Figure SMS_34
(7)
式中,
Figure SMS_35
为归一化指数函数,/>
Figure SMS_36
为映射参数,/>
Figure SMS_37
为模型参数。
优选地,所述步骤4中,具体包括以下步骤:
步骤4.1,基于文本分类算法TextCNN构建冲击危险性等级判别模型;
所述冲击危险性等级判别模型包括输入层、卷积层、池化层和输出层,所述卷积层内设置有三种不同宽度的卷积核,用于对输入层内输入的冲击危险性数据进行卷积并生成特征映射,各卷积核内均设置有两种滤波器,各滤波器计算后得到一个从冲击危险性数据中所提取特征的列向量;所述池化层采用最大池对各特征图处理;所述输出层利用softmax函数处理用于获取冲击危险性数据最终的冲击危险性等级;
步骤4.2,将冲击危险性数据集作为训练冲击危险性等级判别模型所采用的训练集,冲击危险性数据集内挖掘得到的被标记有冲击危险性等级标签的冲击危险性数据作为训练数据,经输入层输入冲击危险性等级判别模型中,同时,获取采场运行过程中新产生的采动数据,重复步骤1,将新采集的采动数据经向量化处理转化为特征向量,对各特征向量进行特征嵌入,转化成维度为
Figure SMS_38
的特征表示后与/>
Figure SMS_39
个嵌入向量拼接形成输入数据,构建输入数据模型/>
Figure SMS_40
,输入数据模型/>
Figure SMS_41
步骤4.3,输入数据经输入层卷积层中,基于文本分类算法TextCNN卷积层中仅使用一维卷积,卷积核从上到下滑动进行特征抽取,设置卷积核的宽度与嵌入向量的维数相一致,卷积核的滑动窗口卷积计算结果,如公式(8)所示:
Figure SMS_42
(8)
式中,
Figure SMS_44
为卷积核的滑动窗口卷积计算结果,/>
Figure SMS_45
为输入数据模型中从
Figure SMS_47
行到/>
Figure SMS_49
行的子矩阵,/>
Figure SMS_51
为输入数据模型的行数,/>
Figure SMS_52
为卷积核,卷积核/>
Figure SMS_53
的维度为/>
Figure SMS_43
,/>
Figure SMS_46
为卷积核的宽度,/>
Figure SMS_48
为偏置项,/>
Figure SMS_50
为激活函数;/>
利用卷积核在输入数据
Figure SMS_54
上滑行进行卷积计算,得到特征图/>
Figure SMS_55
在池化层中对特征图进行最大池化处理,得到多个卷积核的池化结果
Figure SMS_56
,池化结果/>
Figure SMS_57
,/>
Figure SMS_58
为卷积核的数量;
所述各卷积核所采用的处理公式均为:
Figure SMS_59
(9)
式中,
Figure SMS_60
为特征图/>
Figure SMS_61
内的主要特征;
步骤4.4,所述输出层内构建有全连接层,采用softmax激活函数判别新采集采动数据的冲击危险性等级,确定新采集采动数据的冲击危险性等级,并从输出层中输出;
所述输出层中采动数据的冲击危险性等级判别公式为:
Figure SMS_62
(10)
式中,
Figure SMS_63
为采动数据的冲击危险性等级,/>
Figure SMS_64
为dropout层的处理结果,/>
Figure SMS_65
为权重。
本发明具有的有益效果是:
本发明提出了一种基于稀有类挖掘的冲击危险性等级判别方法,通过将采动数据挖掘与机器学习方法相结合实现了对采场冲击危险性等级的准确判别,适用于各类采场中具有良好的通用性。同时,本发明基于文本分类算法TextCNN构建用于判别采动数据冲击危险性等级的冲击危险性等级判别模型,利用采动数据快速判别采场状态并进行分类,提高了采场冲击危险性等级判别的准确性,有利于提前预警采场冲击危险的发生提醒采场工作人员提前采取防护措施,有效保障矿井的高效化采煤,为矿下工作人员提供了安全的工作环境。
附图说明
图1为本发明基于稀有类型数据挖掘算法进行稀有类型检测的流程图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
本发明提出了一种基于稀有类挖掘的冲击危险性等级判别方法,具体包括以下步骤:
步骤1,获取采场运行过程的采动数据,对采动数据进行向量化处理,通过对采动数据分组得到多个采动数据记录序列,提取各采动数据记录序列中的特征参数,构建特征向量,具体包括以下步骤:
步骤1.1,获取采场运行过程的采动数据,设置时间窗的时长,基于时间窗对采动数据进行分组,将采动数据划分为多个采动数据记录序列。
所述采场运行过程受地质条件和开采条件的影响,采动数据用于反映采场运行过程中的地质信息、采掘信息、围岩动态监测信息和支护工况信息,采动数据包括多个指标参数值,所述指标参数包括煤层厚度、煤层倾角、支架型式、支护阻力、微震能量、钻孔应力、老顶初次来压步距和老顶周期来压步距。通过将各指标参数值统一至同一时间点上,实现对多源时空数据的联合处理,综合利用采场的采动数据。
步骤1.2,分别针对各采动数据记录序列,将采动数据记录序列内的各指标参数值统一至同一时间点处,得到处理后的采动数据记录序列。
步骤1.3,根据处理后的各采动数据记录序列,获取各指标参数值在所有处理后采动数据记录序列中出现的频率,确定各指标参数用于向量化的权重因子,如公式(1)所示:
Figure SMS_66
(1)
式中,idf(·)为指标参数用于向量化的权重因子,e为指标参数值,T为采动数据记录序列的总数,num为指标值在所有采动数据记录序列中出现的频次;
步骤1.4,根据各指标参数的权重因子,人工选取指标参数作为特征参数,根据所选特征参数的数量确定特征向量的维度,构建特征向量,特征向量中各维度内的各特征值,如公式(2)所示:
步骤1.4,由于采动数据中部分指标参数与冲击危险性具有强相关性,在提取特征是,需要增加与冲击危险性具有强相关性的指标参数的权重。根据各指标参数的权重因子,人工选取指标参数作为特征参数,根据所选特征参数的数量确定特征向量的维度,构建特征向量,特征向量中各维度内的各特征值,如公式(2)所示:
Figure SMS_67
(2)
式中,weight为特征值;l为用于表示指标参数是否被选取为特征参数的系数,l取值为0或1,当l=0时,表示指标参数被选取为特征参数,当l=1时,表示指标参数未被选取为特征参数;norm(·)为标准化函数;m为用于表示指标参数是否被格外关注,m取值为0或1,当m=0时,表示指标参数被格外关注,当m=1时,表示指标参数未被格外关注。
本实施例经特征向量中各特征值经处理后取值范围为[0,2]。
步骤2,利用特征向量生成整体数据集,基于具有先验知识的稀有类型数据挖掘算法CLOVER对整体数据集进行稀有类型检测,获取各种子数据的冲击危险性等级,并利用带有冲击危险性等级标签的种子数据作为训练数据形成训练集,如图1所示,具体包括以下步骤:
步骤2.1,根据特征向量中各维度内的各特征值构建整体数据集,设置稀有类型检测的检测次数和标签数量,构建整体数据集的K近邻图。
步骤2.2,基于具有先验知识的稀有类型数据挖掘算法CLOVER对整体数据集进行稀有类型检测。
确定K近邻图中各数据点的局部变更度值,在K近邻图中选取局部变更度值最大的数据点作为最大局部变更度数据记录DlvdMax,判断最大局部变更度数据记录DlvdMax是否与冲击危险性相关,若最大局部变更度数据记录DlvdMax与冲击危险性相关,则将最大局部变更度数据记录DlvdMax作为用于异常数据挖掘的种子数据,若最大局部变更度数据记录DlvdMax与冲击危险性无关,则忽略最大局部变更度数据记录DlvdMax
步骤2.3,根据K近邻图中各数据点的连接关系,利用最大局部变更度数据记录DlvdMax的所有相邻数据点构建数据记录集E,将数据记录集E中所有数据点的局部变更度值均设置为-1。
最大局部变更度数据记录DlvdMax周围相邻数据点的LVD值往往也很高,如果重复挖掘同一类型的数据记录则会做很多无用功,所以当得到一个最大局部变更度数据记录DlvdMax后,将该最大局部变更度数据记录DlvdMax在K近邻图中的相邻数据点均作为已经考虑过的数据记录中,防止同一稀有类型的重复检测。
步骤2.4,对数据记录集E中所有数据点人工设置冲击危险性等级标签,获取当前的人工贴标量,若当前的人工贴标量未达到预设的标签数量,则返回步骤2.2中,继续对整体数据集进行稀有类型检测,否则,则进入步骤2.5中。
步骤2.5,结束对整体数据集的稀有类型检测,将稀有类型检测所获取的带有冲击危险性等级标签的种子数据作为训练数据,形成用于深度学习的训练集。
所述K近邻图中数据点的局部变更度值计算公式为:
Figure SMS_68
(3)
其中,
Figure SMS_69
(4)
Figure SMS_70
(5)
式中,
Figure SMS_72
为数据点的局部变更度值,/>
Figure SMS_73
为数据点的变更值,/>
Figure SMS_76
为数据点的孤立值,/>
Figure SMS_77
、/>
Figure SMS_79
均为K近邻图中数据点的名称,/>
Figure SMS_81
为稀有类型检测的检测次数,/>
Figure SMS_83
为数据点的相邻数据点所构成的近邻集合,/>
Figure SMS_71
为最小距离求取函数,/>
Figure SMS_74
为数据点的/>
Figure SMS_75
个相邻数据点所构成的集合,/>
Figure SMS_78
为数据点距离第/>
Figure SMS_80
个相邻数据点的距离,/>
Figure SMS_82
为整体数据集,/>
Figure SMS_84
为最大距离求取函数。
本实施例所述步骤2中,当人工贴标量达到预设的标签数量时,表示稀有类检测过程结束,检测过程中所保留的数据记录为各种冲击危险性等级的代表数据记录,数据记录集E中的冲击危险性等级的数量和特征为代表数据记录的数量和特征,代表数据记录所属的冲击危险性等级与同一个稀有类中的其它数据记录相同。
所述稀有类检测过程不仅实现了对训练集所存在冲击危险性等级的分析,还提取出了各冲击危险性等级中最具有代表性的数据记录。检测过程只需要对每种冲击危险性等级的代表数据记录进行人工贴标的工作。相比于其他监督方法,本发明方法的工作量较少,只需要进行很少的人工贴标工作量。步骤1中获取的采动数据本身没有冲击危险性等级标签的,需要依赖于基于数据训练后的分类器进行标记,而分类器分类的准确率取决于训练集内训练数据的质量。因此,由于训练集中的正常数据往往远多于异常数据,采用本发明方法更有利于从数据空间中挖掘指导采场安全生产的有价值数据,快速标记数据记录的冲击危险性等级标签。
步骤3,基于深度学习方法构建冲击危险性等级检测模型,利用训练集训练冲击危险性等级检测模型挖掘训练数据学习生成冲击危险性等级标签,并将冲击危险性等级标签标记在所输入的种子数据上,得到被标记有冲击危险性等级标签的冲击危险性数据,形成冲击危险性数据集,具体包括以下步骤:
步骤3.1,基于TextCNN分类算法构建用于冲击危险性数据挖掘的冲击危险性等级检测模型,所述冲击危险性等级检测模型包括输入层、卷积层和输出层。
步骤3.2,利用训练集中的训练数据训练冲击危险性等级检测模型。
将训练集中的N个训练数据依次输入至冲击危险性等级检测模型的输入层中,所述输入层分别获取各训练数据中的种子数据和冲击危险性等级标签,并将训练数据输入至卷积层中;
所述卷积层具有非线性映射的能力,用于卷积处理提取训练数据中的有利信息,各训练数据经过卷积层处理后得到卷积映射结果,将各训练数据的卷积映射结果作为迭代优化函数的学习特征,对迭代优化函数进行优化,并利用迭代优化函数进行聚类并生成冲击危险性等级标签,预测得到种子数据的冲击危险性等级标签并标记在种子数据上,通过所述输出层输出预测的冲击危险性等级标签。
步骤3.3,确定训练后的冲击危险性等级检测模型,利用训练后的冲击危险性等级检测模型挖掘剩余数据用于为采场数据标记冲击危险性数据,得到被标记有冲击危险性等级标签的冲击危险性数据,形成冲击危险性数据集。
所述步骤3中,冲击危险性等级检测模型的迭代优化函数为:
Figure SMS_85
(6)
式中,
Figure SMS_86
为训练数据的序号,/>
Figure SMS_87
为第/>
Figure SMS_89
个训练数据中的种子数据,/>
Figure SMS_90
为第/>
Figure SMS_92
个训练数据的冲击危险性等级标签,/>
Figure SMS_93
为稀有类型检测的类别数,/>
Figure SMS_95
为种子数据的卷积映射结果,/>
Figure SMS_88
为学习矩阵,学习矩阵/>
Figure SMS_91
的尺寸为/>
Figure SMS_94
,/>
Figure SMS_96
为各批次输入的数据个数;/>
Figure SMS_97
为训练数据的总数,/>
Figure SMS_98
为实数集。
所述冲击危险性等级检测模型中设置损失函数为:
Figure SMS_99
(7)
式中,
Figure SMS_100
为归一化指数函数,/>
Figure SMS_101
为映射参数,/>
Figure SMS_102
为模型参数。
本实施例中,利用训练数据不断训练迭代优化函数学习被标记有冲击危险性等级标签的种子数据,使用迭代优化函数对特征进行聚类产生冲击危险性等级标签,更新损失函数中的映射参数和模型参数,对剩余数据记录挖掘以产生预测标签并自动贴标。
当挖掘过程结束时,即得到了多种带有冲击危险性等级的冲击危险性数据,本发明方法在整个冲击危险性相关数据挖掘阶段无需采用数据集的先验知识,可以直接处理采动数据进,具有良好的便捷性。同时,本实施例冲击危险性相关数据挖掘阶段中,仅需对多类冲击危险性等级的代表数据进行人工鉴别,并自动完成同类冲击危险性相关数据的贴标工作,有效减少了稀有类相关数据挖缺过程中的人力消耗。
步骤4,基于文本分类算法TextCNN构建冲击危险性等级判别模型,用于判别采动数据的冲击危险性等级,将稀有类型挖掘得到的冲击危险性数据集中的冲击危险性数据作为训练数据,对冲击危险性等级判别模型进行训练,利用训练后的冲击危险性等级判别模型判别新采集采动数据的冲击危险性等级,具体包括以下步骤:
步骤4.1,基于文本分类算法TextCNN构建冲击危险性等级判别模型。
所述冲击危险性等级判别模型包括输入层、卷积层、池化层和输出层,所述卷积层内设置有三种不同宽度的卷积核,用于对输入层内输入的冲击危险性数据进行卷积并生成特征映射,本实施例中第一种卷积核的宽度设置为2,第二种卷积核的宽度设置为3,第三种卷积核的宽度设置为4,各卷积核内均设置有两种滤波器,各滤波器计算后得到一个从冲击危险性数据中所提取特征的列向量;所述池化层采用最大池对各特征图处理;所述输出层利用softmax函数处理用于获取冲击危险性数据最终的冲击危险性等级。
步骤4.2,将冲击危险性数据集作为训练冲击危险性等级判别模型所采用的训练集,冲击危险性数据集内挖掘得到的被标记有冲击危险性等级标签的冲击危险性数据作为训练数据,经输入层输入冲击危险性等级判别模型中,同时,获取采场运行过程中新产生的采动数据,重复步骤1,将新采集的采动数据经向量化处理转化为特征向量,对各特征向量进行特征嵌入,转化成维度为
Figure SMS_103
的特征表示后与/>
Figure SMS_104
个嵌入向量拼接形成输入数据,构建输入数据模型/>
Figure SMS_105
,输入数据模型/>
Figure SMS_106
步骤4.3,输入数据经输入层卷积层中,基于文本分类算法TextCNN卷积层中仅使用一维卷积,卷积核从上到下滑动进行特征抽取,由于只有当卷积核的宽度与嵌入向量的维数相同时,卷积核和输入数据模型的列数相同,卷积核提取的各冲击危险性数据记录才是完整的,所以设置卷积核的宽度与嵌入向量的维数相一致,卷积核的滑动窗口卷积计算结果,如公式(8)所示:
Figure SMS_107
(8)
式中,
Figure SMS_109
为卷积核的滑动窗口卷积计算结果,/>
Figure SMS_110
为输入数据模型中从
Figure SMS_112
行到/>
Figure SMS_114
行的子矩阵,/>
Figure SMS_115
为输入数据模型的行数,/>
Figure SMS_117
为卷积核,卷积核/>
Figure SMS_118
的维度为/>
Figure SMS_108
,/>
Figure SMS_111
为卷积核的宽度,/>
Figure SMS_113
为偏置项,/>
Figure SMS_116
为激活函数。
利用卷积核在输入数据
Figure SMS_119
上滑行进行卷积计算,得到特征图/>
Figure SMS_120
在池化层中对特征图进行最大池化处理,得到多个卷积核的池化结果
Figure SMS_121
,池化结果/>
Figure SMS_122
,/>
Figure SMS_123
为卷积核的数量。
所述各卷积核所采用的处理公式均为:
Figure SMS_124
(9)
式中,
Figure SMS_125
为特征图/>
Figure SMS_126
内的主要特征。
步骤4.4,所述输出层内构建有全连接层,采用softmax激活函数判别新采集采动数据的冲击危险性等级,确定新采集采动数据的冲击危险性等级,并从输出层中输出。
所述输出层中采动数据的冲击危险性等级判别公式为:
Figure SMS_127
(10)
式中,
Figure SMS_128
为采动数据的冲击危险性等级,/>
Figure SMS_129
为dropout层的处理结果,/>
Figure SMS_130
为权重。/>
本实施例中通过将各卷积核的最大值相连接,在特征图中捕获主要特征
Figure SMS_131
的同时大幅度降低了参数数目,降低了冲击危险性等级判别模型的过拟合风险。
基于文本分类算法TextCNN具有在简单网络结构的前提下仍具有优秀的训练效果,在多种评估指标上均能超过最邻近结点算法等经典模型。本发明模型另一个优势是参数数目少,计算量少且对硬件要求不高,训练速度快。通过实验得到当基于文本分类算法TextCNN构建冲击危险性等级判别模型,处理165万的采动数据时,仅需要半个小时左右即可收敛。
相比于有限状态机等非监督方法,仅能发现采场出现了冲击危险性,却无法判定冲击危险性等级,本发明方法实现了对冲击危险性等级的判别,便于现场安全员快速对冲击危险性做出相应的反应。此外,本发明方法着重于占比很少的异常数据,对整体数据的稀有类进行探索,实现了对整体数据中比例较小的异常数据的挖掘。
为了验证本发明提出的基于稀有类挖掘的冲击危险性等级判别方法的可行性与优越性,采用本发明方法处理某煤矿采场作业产生的采动数据,将时间窗口的时间单位设置为小时,通过时间窗口的形式对采动数据进行分组,对采动数据进行向量化处理,得到8种特征,以小时作为单位分组并提取特征向量后得到1248个特征向量。
本发明利用采动数据向量化处理得到的特征向量进行稀有类检测,在检测得到的稀有类数据记录中筛选与冲击危险性相关的稀有类,统计各种冲击危险性等级在特征向量集中的相关数量,将冲击危险性等级划分为0、1、2和3,当冲击危险性等级划分为0时,表示无冲击,当冲击危险性等级划分为1时,表示弱冲击,当冲击危险性等级划分为2时,表示中等冲击,当冲击危险性等级划分为3时,表示强冲击。
本实施例中冲击危险性等级为0的特征向量数为1037,冲击危险性等级为1的特征向量数为110,冲击危险性等级为2的特征向量数为74,冲击危险性等级为3的特征向量数为26。
为了进一步验证本发明方法基于文本分类算法TextCNN所构建冲击危险性等级判别模型的性能,将采用本发明构建的冲击危险性等级判别模型分别与多层感知机(MLP)、反向传播神经网络(BP)、深度神经网络(DNN)、深度置信网络(DBN)、支持向量机(SVM)、K最近邻算法(KNN)、自适应提升算法(Adaboost)、TextRNN_att模型、TextRCNN模型和Fasttext模型进行比较。
其中,多层感知机由输入层、至少一个隐藏层和输出层组成,多层感知机中层与层之间是全连接的。反向传播神经网络作为一个有监督的神经网络,学习过程由正向和反向两部分组成。网络首先计算输出值与期望输出值之间的误差,然后利用误差进行反向传播调整各层单元的连接权重。深度神经网络的网络结构与多层感知机类似,但是多层感知机的层数少于深度神经网络,深度神经网络的隐藏层大于两层。深度置信网络是由受限玻尔兹曼机和Sigmoid信念网络构成的混合生成模型,模型中各节点均服从伯努利分布。支持向量机作为一个经典的分类器,通过构造分割平面分离数据,在训练过程中利用正则化避免过拟合问题。K最近邻算法基于任一样本在特征空间中最相邻的K个样本大多属于同一类别,对样本进行分类。自适应提升算法作为分类算法中的集成算法,所采用的决策树通常很浅,只有一个根节点和两个叶节点。TextRNN_att模型采用注意力机制和双向长短时记忆网络捕获向量中最重要语义信息用于分类。TextRCNN模型设置为双向循环结构,利用循环神经网络解决分类问题,最大程度捕获向量信息。Fasttext模型结构简单,仅设置一层隐藏层,训练速度非常快。
利用相同的测试数据对各网络模型进行冲击危险性等级判别测试,得到多层感知机的准确率为85.2%、召回率为83%和F1值为44.5%,反向传播神经网络的准确率为80.4%、召回率为25%和F1值为22.3%,深度神经网络的准确率为82.17%、召回率为25%和F1值为21.4%,深度置信网络的准确率为86%、召回率为25%和F1值为23.19%,支持向量机的准确率为84%、召回率为81.7%和F1值为75%,K最近邻算法的准确率为81%、召回率为79.4%和F1值为72%,自适应提升算法的准确率为82.5%、召回率为78.1%和F1值为78%,TextRNN_att模型的准确率为83.2%、召回率为80.4%和F1值为78.2%,TextRCNN模型的准确率为84%、召回率为81.1%和F1值为77.5%,Fasttext模型的准确率为85.6%、召回率为83%和F1值为74%,本发明方法基于文本分类算法TextCNN所构建冲击危险性等级判别模型的准确率为88%、召回率为84%和F1值为83.6%。
通过对比可得,采用本发明方法基于文本分类算法TextCNN所构建冲击危险性等级判别模型的算法准确率、召回率和F1值均是最高的,相比于为了文本分类所提出的TextRNN_att模型、TextRCNN模型和Fasttext模型,本发明方法基于文本分类算法TextCNN所构建冲击危险性等级判别模型相比于其他文本分类算法中准确率排名第一的Fasttext模型,准确率提高了2.4%、F1值提高了9.6%。相比于其他经典分类算法,本发明方法基于文本分类算法TextCNN所构建冲击危险性等级判别模型相比于其他经典分类算法中准确率排名第一的深度置信网络,准确率提高了2%,相比于其他经典分类算法中召回率排名第一的多层感知机,召回率提高了1%,相比于其他经典分类算法中F1值排名第一的自适应提升算法,F1值提高了6%。反向传播神经网络、深度神经网络和深度置信网络的召回率均未25%,这是因为在分类过程中,这些算法无法学习到稀有类的数据特征,对稀有类无法正确进行等级判别。
通过分析各网络模型的测试结果可知,基于向量化处理的采动数据和稀有类型算法检测后,获得的贴标采动数据在卷积神经网络中能够被很好的学习,基于文本分类算法TextCNN所构建冲击危险性等级判别模型深度挖掘了采动数据的特征,经过不断迭代训练,冲击危险性等级判别模型对冲击危险性等级判断的准确率达到了88%,能够用于提前预测煤矿的冲击危险并快速采取响应措施,有利于减少事故的发生。
当然,以上说明仅仅为本发明的较佳实施例,本发明并不限于列举上述实施例,应当说明的是,任何熟悉本领域的技术人员在本说明书的教导下,所做出的所有等同替代、明显变形形式,均落在本说明书的实质范围之内,理应受到本发明的保护。

Claims (7)

1.一种基于稀有类挖掘的冲击危险性等级判别方法,其特征在于,包括如下步骤:
步骤1,获取采场运行过程的采动数据,对采动数据进行向量化处理,通过对采动数据分组得到多个采动数据记录序列,提取各采动数据记录序列中的特征参数,构建特征向量;
步骤2,利用特征向量生成整体数据集,基于具有先验知识的稀有类型数据挖掘算法CLOVER对整体数据集进行稀有类型检测,获取各种子数据的冲击危险性等级,并利用带有冲击危险性等级标签的种子数据作为训练数据,形成训练集;
步骤3,基于深度学习方法构建冲击危险性等级检测模型,利用训练集训练冲击危险性等级检测模型挖掘训练数据学习生成冲击危险性等级标签,并将冲击危险性等级标签标记在所输入的种子数据上,得到被标记有冲击危险性等级标签的冲击危险性数据,形成冲击危险性数据集;
步骤4,基于文本分类算法TextCNN构建冲击危险性等级判别模型,用于判别采动数据的冲击危险性等级,将稀有类型挖掘得到的冲击危险性数据集中的冲击危险性数据作为训练数据,对冲击危险性等级判别模型进行训练,利用训练后的冲击危险性等级判别模型判别新采集采动数据的冲击危险性等级。
2.根据权利要求1所述的基于稀有类挖掘的冲击危险性等级判别方法,其特征在于,所述步骤1中,具体包括以下步骤:
步骤1.1,获取采场运行过程的采动数据,设置时间窗的时长,基于时间窗对采动数据进行分组,将采动数据划分为多个采动数据记录序列;
所述采动数据用于反映采场运行过程中的地质信息、采掘信息、围岩动态监测信息和支护工况信息,采动数据包括多个指标参数值,所述指标参数包括煤层厚度、煤层倾角、支架型式、支护阻力、微震能量、钻孔应力、老顶初次来压步距和老顶周期来压步距;
步骤1.2,分别针对各采动数据记录序列,将采动数据记录序列内的各指标参数值统一至同一时间点处,得到处理后的采动数据记录序列;
步骤1.3,根据处理后的各采动数据记录序列,获取各指标参数值在所有处理后采动数据记录序列中出现的频率,确定各指标参数用于向量化的权重因子,如公式(1)所示:
Figure QLYQS_1
(1)
式中,idf(·)为指标参数用于向量化的权重因子,e为指标参数值,T为采动数据记录序列的总数,num为指标值在所有采动数据记录序列中出现的频次;
步骤1.4,根据各指标参数的权重因子,人工选取指标参数作为特征参数,根据所选特征参数的数量确定特征向量的维度,构建特征向量,特征向量中各维度内的各特征值,如公式(2)所示:
Figure QLYQS_2
(2)
式中,weight为特征值;l为用于表示指标参数是否被选取为特征参数的系数,l取值为0或1,当l=0时,表示指标参数被选取为特征参数,当l=1时,表示指标参数未被选取为特征参数;norm(·)为标准化函数;m为用于表示指标参数是否被格外关注,m取值为0或1,当m=0时,表示指标参数被格外关注,当m=1时,表示指标参数未被格外关注。
3.根据权利要求2所述的基于稀有类挖掘的冲击危险性等级判别方法,其特征在于,所述步骤2中,具体包括以下步骤:
步骤2.1,根据特征向量中各维度内的各特征值构建整体数据集,设置稀有类型检测的检测次数和标签数量,构建整体数据集的K近邻图;
步骤2.2,基于具有先验知识的稀有类型数据挖掘算法CLOVER对整体数据集进行稀有类型检测;
确定K近邻图中各数据点的局部变更度值,在K近邻图中选取局部变更度值最大的数据点作为最大局部变更度数据记录DlvdMax,判断最大局部变更度数据记录DlvdMax是否与冲击危险性相关,若最大局部变更度数据记录DlvdMax与冲击危险性相关,则将最大局部变更度数据记录DlvdMax作为用于异常数据挖掘的种子数据,若最大局部变更度数据记录DlvdMax与冲击危险性无关,则忽略最大局部变更度数据记录DlvdMax
步骤2.3,根据K近邻图中各数据点的连接关系,利用最大局部变更度数据记录DlvdMax的所有相邻数据点构建数据记录集E,将数据记录集E中所有数据点的局部变更度值均设置为-1;
步骤2.4,对数据记录集E中所有数据点人工设置冲击危险性等级标签,获取当前的人工贴标量,若当前的人工贴标量未达到预设的标签数量,则返回步骤2.2中,继续对整体数据集进行稀有类型检测,否则,则进入步骤2.5中;
步骤2.5,结束对整体数据集的稀有类型检测,将稀有类型检测所获取的带有冲击危险性等级标签的种子数据作为训练数据,形成用于深度学习的训练集。
4.根据权利要求3所述的基于稀有类挖掘的冲击危险性等级判别方法,其特征在于,所述K近邻图中数据点的局部变更度值计算公式为:
Figure QLYQS_3
(3)
其中,
Figure QLYQS_4
(4)
Figure QLYQS_5
(5)
式中,
Figure QLYQS_7
为数据点的局部变更度值,/>
Figure QLYQS_8
为数据点的变更值,/>
Figure QLYQS_10
为数据点的孤立值,/>
Figure QLYQS_12
Figure QLYQS_14
均为K近邻图中数据点的名称,/>
Figure QLYQS_16
为稀有类型检测的检测次数,/>
Figure QLYQS_17
为数据点的相邻数据点所构成的近邻集合,/>
Figure QLYQS_6
为最小距离求取函数,/>
Figure QLYQS_9
为数据点的/>
Figure QLYQS_11
个相邻数据点所构成的集合,/>
Figure QLYQS_13
为数据点距离第/>
Figure QLYQS_15
个相邻数据点的距离,/>
Figure QLYQS_18
为整体数据集,/>
Figure QLYQS_19
为最大距离求取函数。
5.根据权利要求4所述的基于稀有类挖掘的冲击危险性等级判别方法,其特征在于,所述步骤3中,具体包括以下步骤:
步骤3.1,基于TextCNN分类算法构建用于冲击危险性数据挖掘的冲击危险性等级检测模型,所述冲击危险性等级检测模型包括输入层、卷积层和输出层;
步骤3.2,利用训练集中的训练数据训练冲击危险性等级检测模型;
将训练集中的N个训练数据依次输入至冲击危险性等级检测模型的输入层中,所述输入层分别获取各训练数据中的种子数据和冲击危险性等级标签,并将训练数据输入至卷积层中;
所述卷积层具有非线性映射的能力,用于卷积处理提取训练数据中的有利信息,各训练数据经过卷积层处理后得到卷积映射结果,将各训练数据的卷积映射结果作为迭代优化函数的学习特征,对迭代优化函数进行优化,并利用迭代优化函数进行聚类并生成冲击危险性等级标签,预测得到种子数据的冲击危险性等级标签并标记在种子数据上,通过所述输出层输出预测的冲击危险性等级标签;
步骤3.3,确定训练后的冲击危险性等级检测模型,利用训练后的冲击危险性等级检测模型挖掘剩余数据用于为采场数据标记冲击危险性数据,得到被标记有冲击危险性等级标签的冲击危险性数据,形成冲击危险性数据集。
6.根据权利要求5所述的基于稀有类挖掘的冲击危险性等级判别方法,其特征在于,所述步骤3中,冲击危险性等级检测模型的迭代优化函数为:
Figure QLYQS_20
(6)
式中,
Figure QLYQS_22
为训练数据的序号,/>
Figure QLYQS_24
为第/>
Figure QLYQS_25
个训练数据中的种子数据,/>
Figure QLYQS_27
为第/>
Figure QLYQS_29
个训练数据的冲击危险性等级标签,/>
Figure QLYQS_31
为稀有类型检测的类别数,/>
Figure QLYQS_32
为种子数据的卷积映射结果,
Figure QLYQS_21
为学习矩阵,学习矩阵/>
Figure QLYQS_23
的尺寸为/>
Figure QLYQS_26
,/>
Figure QLYQS_28
为各批次输入的数据个数;/>
Figure QLYQS_30
为训练数据的总数,/>
Figure QLYQS_33
为实数集;
所述冲击危险性等级检测模型中设置损失函数为:
Figure QLYQS_34
(7)
式中,
Figure QLYQS_35
为归一化指数函数,/>
Figure QLYQS_36
为映射参数,/>
Figure QLYQS_37
为模型参数。
7.根据权利要求6所述的基于稀有类挖掘的冲击危险性等级判别方法,其特征在于,所述步骤4中,具体包括以下步骤:
步骤4.1,基于文本分类算法TextCNN构建冲击危险性等级判别模型;
所述冲击危险性等级判别模型包括输入层、卷积层、池化层和输出层,所述卷积层内设置有三种不同宽度的卷积核,用于对输入层内输入的冲击危险性数据进行卷积并生成特征映射,各卷积核内均设置有两种滤波器,各滤波器计算后得到一个从冲击危险性数据中所提取特征的列向量;所述池化层采用最大池对各特征图处理;所述输出层利用softmax函数处理用于获取冲击危险性数据最终的冲击危险性等级;
步骤4.2,将冲击危险性数据集作为训练冲击危险性等级判别模型所采用的训练集,冲击危险性数据集内挖掘得到的被标记有冲击危险性等级标签的冲击危险性数据作为训练数据,经输入层输入冲击危险性等级判别模型中,同时,获取采场运行过程中新产生的采动数据,重复步骤1,将新采集的采动数据经向量化处理转化为特征向量,对各特征向量进行特征嵌入,转化成维度为
Figure QLYQS_38
的特征表示后与/>
Figure QLYQS_39
个嵌入向量拼接形成输入数据,构建输入数据模型/>
Figure QLYQS_40
,输入数据模型/>
Figure QLYQS_41
步骤4.3,输入数据经输入层卷积层中,基于文本分类算法TextCNN卷积层中仅使用一维卷积,卷积核从上到下滑动进行特征抽取,设置卷积核的宽度与嵌入向量的维数相一致,卷积核的滑动窗口卷积计算结果,如公式(8)所示:
Figure QLYQS_42
(8)
式中,
Figure QLYQS_44
为卷积核的滑动窗口卷积计算结果,/>
Figure QLYQS_45
为输入数据模型中从/>
Figure QLYQS_47
行到
Figure QLYQS_49
行的子矩阵,/>
Figure QLYQS_50
为输入数据模型的行数,/>
Figure QLYQS_52
为卷积核,卷积核/>
Figure QLYQS_53
的维度为/>
Figure QLYQS_43
Figure QLYQS_46
为卷积核的宽度,/>
Figure QLYQS_48
为偏置项,/>
Figure QLYQS_51
为激活函数;
利用卷积核在输入数据
Figure QLYQS_54
上滑行进行卷积计算,得到特征图/>
Figure QLYQS_55
在池化层中对特征图进行最大池化处理,得到多个卷积核的池化结果
Figure QLYQS_56
,池化结果
Figure QLYQS_57
,/>
Figure QLYQS_58
为卷积核的数量;
所述各卷积核所采用的处理公式均为:
Figure QLYQS_59
(9)
式中,
Figure QLYQS_60
为特征图/>
Figure QLYQS_61
内的主要特征;
步骤4.4,所述输出层内构建有全连接层,采用softmax激活函数判别新采集采动数据的冲击危险性等级,确定新采集采动数据的冲击危险性等级,并从输出层中输出;
所述输出层中采动数据的冲击危险性等级判别公式为:
Figure QLYQS_62
(10)
式中,
Figure QLYQS_63
为采动数据的冲击危险性等级,/>
Figure QLYQS_64
为dropout层的处理结果,/>
Figure QLYQS_65
为权重。/>
CN202310442993.7A 2023-04-24 2023-04-24 一种基于稀有类挖掘的冲击危险性等级判别方法 Active CN116204820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310442993.7A CN116204820B (zh) 2023-04-24 2023-04-24 一种基于稀有类挖掘的冲击危险性等级判别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310442993.7A CN116204820B (zh) 2023-04-24 2023-04-24 一种基于稀有类挖掘的冲击危险性等级判别方法

Publications (2)

Publication Number Publication Date
CN116204820A true CN116204820A (zh) 2023-06-02
CN116204820B CN116204820B (zh) 2023-07-21

Family

ID=86514952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310442993.7A Active CN116204820B (zh) 2023-04-24 2023-04-24 一种基于稀有类挖掘的冲击危险性等级判别方法

Country Status (1)

Country Link
CN (1) CN116204820B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190050673A1 (en) * 2017-08-14 2019-02-14 Tata Consultancy Services Limited Synthetic rare class generation by preserving morphological identity
CN109376179A (zh) * 2018-08-24 2019-02-22 苏宁消费金融有限公司 一种数据挖掘中样本平衡化方法
CN109948705A (zh) * 2019-03-20 2019-06-28 武汉大学 一种基于k近邻图的稀有类检测方法及装置
WO2019144066A1 (en) * 2018-01-22 2019-07-25 Jack Copper Systems and methods for preparing data for use by machine learning algorithms
CN112015894A (zh) * 2020-08-19 2020-12-01 银江股份有限公司 一种基于深度学习的文本单类分类方法及系统
WO2021244249A1 (zh) * 2020-05-30 2021-12-09 华为技术有限公司 一种分类器的训练方法、数据处理方法、系统以及设备
CN114881102A (zh) * 2022-03-21 2022-08-09 黄淮学院 一种面向数值型数据的稀有类检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190050673A1 (en) * 2017-08-14 2019-02-14 Tata Consultancy Services Limited Synthetic rare class generation by preserving morphological identity
WO2019144066A1 (en) * 2018-01-22 2019-07-25 Jack Copper Systems and methods for preparing data for use by machine learning algorithms
CN109376179A (zh) * 2018-08-24 2019-02-22 苏宁消费金融有限公司 一种数据挖掘中样本平衡化方法
CN109948705A (zh) * 2019-03-20 2019-06-28 武汉大学 一种基于k近邻图的稀有类检测方法及装置
WO2021244249A1 (zh) * 2020-05-30 2021-12-09 华为技术有限公司 一种分类器的训练方法、数据处理方法、系统以及设备
CN112015894A (zh) * 2020-08-19 2020-12-01 银江股份有限公司 一种基于深度学习的文本单类分类方法及系统
CN114881102A (zh) * 2022-03-21 2022-08-09 黄淮学院 一种面向数值型数据的稀有类检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FEI YAN等: ""End-to-End: A Simple Template for the Long-Tailed-Recognition of Transmission Line Clamps via a Vision-Language Model"", 《APPLIED SCIENCES》, vol. 13, no. 5 *
HAO HUANG等: ""CLOVER: a faster prior-free approach to rare-category detection"", 《KNOWLEDGE AND INFORMATION SYSTEMS》, vol. 35 *
杨屹: ""基于稀有类分类的信用卡欺诈识别研究"", 《硕士电子期刊》, vol. 2014, no. 06 *

Also Published As

Publication number Publication date
CN116204820B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
Zhong et al. Using machine learning methods to identify coal pay zones from drilling and logging-while-drilling (LWD) data
CN107122860B (zh) 基于网格搜索和极限学习机的冲击地压危险等级预测方法
CN112529341B (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
CN113431635B (zh) 半监督的盾构隧道掌子面地质类型预估方法及系统
Tsuchihashi et al. Early stuck pipe sign detection with depth-domain 3D convolutional neural network using actual drilling data
CN110020714B (zh) 模型训练及数据分析方法、装置、设备以及存储介质
CN111507371A (zh) 方法和装置
CN115130375A (zh) 一种岩爆烈度预测方法
Zhong et al. Using machine learning methods to identify coals from drilling and logging-while-drilling LWD data
Zhang et al. Cross-project prediction for rock mass using shuffled TBM big dataset and knowledge-based machine learning methods
CN113902861A (zh) 一种基于机器学习的三维地质建模方法
CN112529678A (zh) 一种基于自监督判别式网络的金融指数时序异常检测方法
CN117272841B (zh) 一种基于混合神经网络的页岩气甜点预测方法
Li et al. A rockburst prediction model based on extreme learning machine with improved Harris Hawks optimization and its application
CN116204820B (zh) 一种基于稀有类挖掘的冲击危险性等级判别方法
CN114021620A (zh) 基于bp神经网络特征提取的电潜泵故障诊断方法
CN117093922A (zh) 一种基于改进svm的不平衡样本油藏复杂流体识别方法
CN115860582B (zh) 一种基于自适应提升算法的冲击危险性智能预警方法
CN115964667A (zh) 基于深度学习和重采样的河流-湖泊岩相测井识别方法
CN116402226A (zh) 一种基于改进卷积神经网络的高含水致密砂岩储层产能智能预测方法
CN116366277A (zh) 一种信息融合的网络安全态势评估方法
Yuan et al. Application of Active Learning in Carbonate Lithologic Identification
CN110348510A (zh) 一种基于深水油气钻井过程阶段性特征的数据预处理方法
Aniyom et al. Hybridization of Optimized Supervised Machine Learning Algorithms for Effective Lithology
Li et al. Cross-oilfield reservoir classification via multi-scale sensor knowledge transfer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant