CN110222766B - 一种基于稀疏逆协方差的煤与瓦斯突出预测方法 - Google Patents

一种基于稀疏逆协方差的煤与瓦斯突出预测方法 Download PDF

Info

Publication number
CN110222766B
CN110222766B CN201910492856.8A CN201910492856A CN110222766B CN 110222766 B CN110222766 B CN 110222766B CN 201910492856 A CN201910492856 A CN 201910492856A CN 110222766 B CN110222766 B CN 110222766B
Authority
CN
China
Prior art keywords
coal
gas outburst
class
inverse covariance
characteristic data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910492856.8A
Other languages
English (en)
Other versions
CN110222766A (zh
Inventor
吕俊伟
胡学钢
李培培
廖建兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201910492856.8A priority Critical patent/CN110222766B/zh
Publication of CN110222766A publication Critical patent/CN110222766A/zh
Application granted granted Critical
Publication of CN110222766B publication Critical patent/CN110222766B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2136Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于稀疏逆协方差的煤与瓦斯突出预测方法,其步骤包括:1、将煤与瓦斯突出数据处理成多变量时间序列数据;2、构建一种基于模型的方法来表征多变量煤与瓦斯突出时间序列数据;3、使用Graphical Lasso方法初始化煤与瓦斯突出数据集中每个类别的稀疏逆协方差;4、使用LogDet散度优化稀疏逆协方差;5、选择契合该模型的分类器——最大似然分类器对煤与瓦斯突出测试数据进行分类预测。本发明解决了煤与瓦斯突出数据的表示问题以及代表煤与瓦斯突出每个类别的逆协方差的稀疏性问题,从而能够快速且准确地对煤与瓦斯突出数据进行分类。

Description

一种基于稀疏逆协方差的煤与瓦斯突出预测方法
技术领域
本发明涉及煤矿安全生产领域,具体是一种基于稀疏逆协方差的煤与瓦斯突出预测方法。
背景技术
煤炭是我国国民经济发展中的主体能源和重要原料,然而至今我国煤炭生产的安全形势却依然十分严峻。矿井的瓦斯、煤尘、火灾、水灾和顶板事故是煤矿的五大自然灾害,其中瓦斯是煤矿的头号“杀手”,而煤与瓦斯突出又是瓦斯灾害事故中发生频率高,伤害人数较多的典型动力灾害之一。因此,能够快速、准确的预测煤与瓦斯突出,不仅能提高煤矿生产的安全,而且也会产生巨大的经济效益和社会效益,具有重大的现实意义。
目前主要使用各种传感器监控煤与瓦斯突出,如甲烷传感器、一氧化碳传感器、温度传感器、风流压力传感器等,因而得到的数据都为时间序列数据。传统的预测煤与瓦斯突出的方法主要包括:单项指标法、综合指标法、钻屑瓦斯解吸指标法、R指标法等,这些预测方法仅仅考虑了影响煤与瓦斯突出的某个因素,而且预测指标的临界值的大小会随着不同地区不同矿井而有所不同,这些因素造成煤与瓦斯突出预测结果准确度不高。
近几年,先进的理论方法如计算机模拟、模糊数学理论、灰色系统理论、专家系统、分形理论、非线性理论、流变理论以及人工神经网络等已开始应用于煤与瓦斯突出的分析中,并取得了一定的研究成果。但上述这些方法需要对煤与瓦斯突出数据进行非常严格的处理,并且对煤与瓦斯突出的实时性预测较差。
直接对原始的未处理的煤与瓦斯突出数据进行分类,可大幅提高预测的实时性。而原始的未处理的煤与瓦斯突出数据即为多变量时间序列数据,其含义为多个传感器采集得到的时间序列数据集合。因此,对时间序列数据进行分类从而达到预测目的是一种非常可行且有效的方法。已有一些工作将多变量时间序列分类方法用于预测煤与瓦斯突出问题,但是由于传统多变量时间序列分类方法表征数据能力不强,分类过程计算效率低下以及分类准确率不高,导致该类方法在煤与瓦斯突出预测领域应用不够深入广泛。
发明内容
本发明为克服煤与瓦斯突出数据表征困难、计算效率低下以及预测准确率不高等现有技术存在的不足之处,提供一种基于稀疏逆协方差的煤与瓦斯突出预测方法,以期能快速准确地预测煤与瓦斯突出问题,并提高预测准确率和预测效率。
为了达到上述目的,本发明所采用的技术方案为:
本发明一种基于稀疏逆协方差的煤与瓦斯突出预测方法的特点是按如下步骤进行:
步骤1:获取一组煤与瓦斯突出数据作为训练样本,所述训练样本是由煤与瓦斯突出特征数据T={T1,T2,…,Ti,…,TN}和分类标签数据Y={y1,y2,…,yi,···,yN}组成,其中,Ti表示第i条煤与瓦斯突出特征数据,且Ti=[Ti 1,Ti 2,…,Ti p...,Ti D],Ti p表示所述第i条煤与瓦斯突出特征数据Ti中第p维特征向量,且
Figure BDA0002087603030000021
Figure BDA0002087603030000022
为所述第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的第q个特征值;yi表示第i条煤与瓦斯突出特征数据Ti的分类标签,且yi={j|j=1,2,···,C}表示第j个分类标签,j∈[1,C],C表示分类标签的个数,i∈[1,N],N表示所述训练样本的个数,p∈[1,D],D为所述煤与瓦斯突出特征数据的维度,q∈[1,m],m为所述训练样本中第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的长度;
步骤2、对所述煤与瓦斯突出特征数据T按照分类标签进行划分,得到划分后的煤与瓦斯突出特征数据T″={XT1,XT2,…,XTj,…,XTC},其中,XTj表示第j类的所有煤与瓦斯突出特征数据集合,并有:
Figure BDA0002087603030000023
Figure BDA0002087603030000024
为属于所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量,并有:
Figure BDA0002087603030000025
其中,
Figure BDA0002087603030000026
是所述第p维特征向量
Figure BDA0002087603030000027
的第q′个时间点数据,q′∈[1,m′],m′为所述第p维特征向量
Figure BDA0002087603030000028
的长度;
步骤3:利用式(1)计算所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量
Figure BDA0002087603030000029
的均值μj,p,从而得到所述第j类的所有煤与瓦斯突出特征数据集合XTj的均值矩阵uj={μj,1j,2,…,μj,p,…μj,D};进而得到划分后的煤与瓦斯突出特征数据T″的均值矩阵U={u1,u2,…,uj,…,uC},
Figure BDA00020876030300000210
Figure BDA00020876030300000211
步骤4:利用式(2)计算所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量
Figure BDA00020876030300000212
和第p′维特征向量
Figure BDA00020876030300000213
的协方差
Figure BDA00020876030300000214
从而得到所述第j类的所有煤与瓦斯突出特征数据集合XTj的协方差矩阵
Figure BDA00020876030300000215
进而得到划分后的煤与瓦斯突出特征数据T″的协方差矩阵集合COV={COV1,COV2,…,COVj,…,COVC};
Figure BDA0002087603030000031
步骤5:求解代表划分后的煤与瓦斯突出数据集T″中每个分类标签的稀疏逆协方差矩阵集合Θ:
步骤5.1:定义当前迭代次数为k,并初始化k=0,定义最大迭代次数为maxIter,目标边界为ρ以及正则化参数为η;
步骤5.2:利用式(3)初始化第k代中第j类的稀疏逆协方差矩阵Θj,k,从而得到第k代稀疏逆协方差矩阵集合Θk={Θ1,k2,k,…,Θj,k,…,ΘC,k}:
Θj,k=GraphicalLasso(COVj) (3)
式(3)中:GraphicalLasso(·)表示图形套索Graphical Lasso的求解函数;
步骤5.3:如果k>maxIter,则将Θj,k赋值给Θj,从而得到稀疏逆协方差矩阵集合Θ={Θ12,…,Θj,…,ΘC};否则,初始化i=1;
步骤5.4:如果i>N,则将k+1赋值给k,并执行步骤5.3;否则,利用式(4)计算第k代中所述第i条煤与瓦斯突出特征数据Ti与第j类的稀疏逆协方差集合Θj,k以及均值矩阵uj的对数似然llk,i,j(Tij,k,uj),从而得到第k代中所述第i条煤与瓦斯突出特征数据Ti与每个类的稀疏逆协方差集合Θk以及均值矩阵U的对数似然Lk,i={llk,i,j(Tij,k,uj)|j=1,2,…,C};
Figure BDA0002087603030000032
步骤5.5:对所述对数似然Lk,i降序排列,得到降序排列后的对数似然L′k,i,并将降序排列后的对数似然L′k,i中第一个值赋值给
Figure BDA0002087603030000033
将降序排列后的对数似然L′k,i中第二个值赋值给
Figure BDA0002087603030000034
其中,
Figure BDA0002087603030000035
表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j′类的稀疏逆协方差Θj′,k计算得到的对数似然值;
Figure BDA0002087603030000036
表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j″类的稀疏逆协方差Θj″,k计算得到的对数似然值;
步骤5.6:如果cj′=yi,则执行步骤5.9;否则,执行步骤5.7;
步骤5.7:将第k代中第yi类的稀疏逆协方差矩阵
Figure BDA0002087603030000037
赋值给第k代中第j类代表分类正确的逆协方差
Figure BDA0002087603030000041
将第k代中第j′类的稀疏逆协方差矩阵Θj′,k赋值给第k代中第j类代表分类错误的逆协方差
Figure BDA0002087603030000042
后,分别利用式(5)和式(6)计算更新后的第k代中第j类分类正确的逆协方差
Figure BDA0002087603030000043
以及更新后的第k代中第j类分类错误的逆协方差
Figure BDA0002087603030000044
Figure BDA0002087603030000045
Figure BDA0002087603030000046
步骤5.8:将更新后的第k代中第j类代表分类正确的逆协方差
Figure BDA0002087603030000047
赋值给第k代中第yi类逆协方差
Figure BDA0002087603030000048
将第k代中第j类代表分类错误的逆协方差
Figure BDA0002087603030000049
赋值给第k代中第j′类逆协方差Θj′,k,将i+1赋值给i,执行步骤5.4;
步骤5.9:如果
Figure BDA00020876030300000410
则将i+1赋值给i后,执行步骤5.4;否则,将第k代中第j′类逆协方差Θj′,k赋值给第k代中第j类代表分类正确的逆协方差
Figure BDA00020876030300000411
将将第k代中第j″类逆协方差Θj″,k赋值给第k代中第j类分类错误的逆协方差
Figure BDA00020876030300000412
后,执行步骤5.10;
步骤5.10:利用式(7)计算更新后的第k代中第j类代表分类正确的逆协方差
Figure BDA00020876030300000413
并赋值给Θj′,k,利用式(8)计算第k代中第j类代表分类错误的逆协方差
Figure BDA00020876030300000414
并赋值给Θj″,k后,将i+1赋值给i,并执行步骤5.4;
Figure BDA00020876030300000415
Figure BDA00020876030300000416
步骤6:对煤与瓦斯突出的测试样本进行预测:
步骤6.1:获取另一组煤与瓦斯突出数据作为测试样本,所述测试样本是由煤与瓦斯突出特征数据T′={T1′,T2′,…,Ti′′,…,TN′′}组成,其中,Ti′′表示所述测试样本中第i′条煤与瓦斯突出特征数据;i′∈[1,N′],N′表示所述测试样本的个数;
步骤6.2:利用式(7)计算所述测试样本中第i′条煤与瓦斯突出特征数据Ti′′中第j类的对数似然lli′,j(Ti′′,Θj,uj),从而得到Ti′′与所述测试样本中所有类别的对数似然集合Li′={lli′,j(Ti′′,Θj,uj)|j=1,2,…,C};
Figure BDA0002087603030000051
步骤6.3:计算对数似然集合Li′中最大的对数似然值所对应的类别jmax=argmax{Li′},则jmax即为所述第i′条测试样本的分类标签。
与已有技术相比,本发明的有益效果体现在:
1、本发明基于LogDet散度优化的稀疏逆协方差来表征煤与瓦斯突出数据,提高了模型的数据表征能力,从而提升了煤与瓦斯突出预测的准确度;
2、本发明中提出的预测模型直接对各个传感器实时采集得到的煤与瓦斯突出数据进行处理,相比传统技术需使用经过多步处理的数据而言,本发明极大提升了数据的实时利用率;并通过将计算所有煤与瓦斯突出数据的逆协方差转化为计算每个类别的逆协方差,降低了预测模型的计算量,从而提高了计算速度,并从数据利用及计算过程两方面保证了能够快速预测煤与瓦斯突出,达到了具有预测实时性的效果。
3、由于煤与瓦斯突出数据的高维性和大样本性,传统预测煤与瓦斯突出的方法容易产生过拟合现象,本发明中采用Graphical Lasso算法对表征煤与瓦斯突出数据集中每个类别的逆协方差进行稀疏化处理,提高了方法计算效率并避免了方法预测时的过拟合问题;同时,本发明针对煤与瓦斯突出预测存在的问题,构建了一种表征数据能力强、预测过程计算效率高且预测准确率高的多变量时间序列分类模型,用于将煤与瓦斯突出各影响因素和突出判据作为一个统一整体进行研究,能够定量描述各影响因素的作用和突出判据,从而能快速准确地预测煤与瓦斯突出问题,为煤与瓦斯突出的综合作用假说等形成机理提供实验依据。
附图说明
图1为本发明中基于稀疏逆协方差的煤与瓦斯突出预测方法的流程图;
图2为本发明中求解稀疏逆协方差的流程图。
具体实施方式
参照图1,本实施例中,一种基于稀疏逆协方差的煤与瓦斯突出预测方法是按如下步骤进行:
步骤1:获取一组煤与瓦斯突出数据作为训练样本。煤矿监控系统中的数据都是由传感器采集而来的,相应的,煤与瓦斯突出数据也是由众多传感器在不同时间段内采集得到的。因此煤与瓦斯突出数据具有多变量和时间属性,专业术语上称为多变量时间序列数据。本实施例中获取的一组训练样本是由煤与瓦斯突出特征数据T={T1,T2,…,Ti,…,TN}和分类标签数据Y={y1,y2,…,yi,···,yN}组成,其中,Ti表示第i条煤与瓦斯突出特征数据,且Ti=[Ti 1,Ti 2,…,Ti p...,Ti D],Ti p表示第i条煤与瓦斯突出特征数据Ti中第p维特征向量,且
Figure BDA0002087603030000061
Figure BDA0002087603030000062
为第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的第q个特征值;yi表示第i条煤与瓦斯突出特征数据Ti的分类标签,且yi={j|j=1,2,···,C}表示第j个分类标签,j∈[1,C],C表示分类标签的个数,i∈[1,N],N表示训练样本的个数,p∈[1,D],D为煤与瓦斯突出特征数据的维度,q∈[1,m],m为训练样本中第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的长度;
本实施例中,以表1中的煤与瓦斯突出训练样本数据(由Python自带的preprocessing.MinMaxScaler函数实现归一化)为例,其中煤与瓦斯突出样本个数N=8,每个训练样本的大小m1=m2=…=m8=4,煤与瓦斯突出样本类别个数C=4,y1=1,y2=2,y3=3,y4=4。这组煤与瓦斯突出训练样本数据由12个传感器采集得到,因此D=12,其中D1为烟雾传感器传感器、D2为采煤工作面回风巷传感器、D3采煤工作面进风巷传感器、D4为掘进工作面采区回风巷甲烷传感器、D5掘进工作面一翼回风巷甲烷传感器、D6掘进工作面总回风巷测风站甲烷传感器、D7为一氧化碳传感器、D8为风速传感器、D9为风压传感器、D10为瓦斯抽放管路流量传感器、D11为瓦斯抽放管路温度传感器、D12为瓦斯抽放管路压力传感器。
表1原始煤与瓦斯突出时间序列训练样本数据
Figure BDA0002087603030000071
步骤2、对煤与瓦斯突出特征数据T按照分类标签进行划分,得到划分后的煤与瓦斯突出特征数据T″={XT1,XT2,…,XTj,…,XTC},其中,XTj表示第j类的所有煤与瓦斯突出特征数据集合,并有:
Figure BDA0002087603030000072
Figure BDA0002087603030000073
为属于第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量,并有:
Figure BDA0002087603030000074
其中,
Figure BDA0002087603030000075
是第p维特征向量
Figure BDA0002087603030000076
的第q′个时间点数据,q′∈[1,m′],m′为第p维特征向量
Figure BDA0002087603030000077
的长度;
合并同类别的所有煤与瓦斯突出特征数据,得到表2的煤与瓦斯突出训练样本数据。因此,T″={XT1,XT2,XT3,XT4}。
表2合并同类别后的煤与瓦斯突出训练样本数据
Figure BDA0002087603030000081
步骤3:利用式(1)计算第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量
Figure BDA0002087603030000082
的均值μj,p,从而得到第j类的所有煤与瓦斯突出特征数据集合XTj的均值矩阵uj={μj,1j,2,…,μj,p,…μj,D};进而得到划分后的煤与瓦斯突出特征数据T″的均值矩阵U={u1,u2,…,uj,…,uC},
Figure BDA0002087603030000083
如图2所示,具体按如下步骤进行:
Figure BDA0002087603030000084
本实施例中,对表2合并同类别后的煤与瓦斯突出训练样本数据求解多元高斯模型的均值参数U={u1,u2,u3,u4},用Python软件自带的均值求解函数mean()对12维的时间序列数据进行均值求解,求解结果如表3所示。
表3煤与瓦斯突出数据的多元高斯模型的均值参数U={u1,u2,u3,u4}
u<sub>1</sub> 1.523004 -0.44643 0.3124 -0.03621 0.115016 -0.12929 -0.21178 -0.08185 -0.11929 -0.20939 -0.12193 0.071331
u<sub>2</sub> 0.974744 -0.97114 0.246467 -0.29719 0.194719 -0.15545 -0.28019 -0.07003 -0.1665 -0.24191 -0.09362 0.133167
u<sub>3</sub> 0.428688 -0.2348 0.061563 -0.37914 0.195163 -0.41358 0.056015 -0.07356 -0.31409 -0.13399 0.018616 0.111583
u<sub>4</sub> 0.687517 -0.82506 0.316253 -0.42229 -0.06324 -0.08093 -0.22819 -0.13748 -0.06799 -0.25847 -0.06736 0.21793
步骤4:利用式(2)计算第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量
Figure BDA0002087603030000091
和第p′维特征向量
Figure BDA0002087603030000092
的协方差
Figure BDA0002087603030000093
从而得到第j类的所有煤与瓦斯突出特征数据集合XTj的协方差矩阵
Figure BDA0002087603030000094
进而得到划分后的煤与瓦斯突出特征数据T″的协方差矩阵集合COV={COV1,COV2,…,COVj,…,COVC};
Figure BDA0002087603030000095
本实施例中,对表2合并同类别后的煤与瓦斯突出训练样本数据求解多元高斯模型的协方差参数COVj,j=1,2,3,4,如表4所示。
表4煤与瓦斯突出数据的多元高斯模型的协方差参数COVj,j=1,2,3,4
Figure BDA0002087603030000101
步骤5:求解代表划分后的煤与瓦斯突出数据集T″中每个分类标签的稀疏逆协方差矩阵集合Θ:
步骤5.1:定义当前迭代次数为k,并初始化k=0,定义最大迭代次数为maxIter,目标边界为ρ以及正则化参数为η;
步骤5.2:利用式(3)初始化第k代中第j类的稀疏逆协方差矩阵Θj,k,从而得到第k代稀疏逆协方差矩阵集合Θk={Θ1,k2,k,…,Θj,k,…,ΘC,k}:
Θj,k=GraphicalLasso(COVj) (3)
式(3)中:GraphicalLasso(·)表示图形套索Graphical Lasso的求解函数;
步骤5.3:如果k>maxIter,则将Θj,k赋值给Θj,从而得到稀疏逆协方差矩阵集合Θ={Θ12,…,Θj,…,ΘC};否则,初始化i=1;
步骤5.4:如果i>N,则将k+1赋值给k,并执行步骤5.3;否则,利用式(4)计算第k代中第i条煤与瓦斯突出特征数据Ti与第j类的稀疏逆协方差集合Θj,k以及均值矩阵uj的对数似然llk,i,j(Tij,k,uj),从而得到第k代中第i条煤与瓦斯突出特征数据Ti与每个类的稀疏逆协方差集合Θk以及均值矩阵U的对数似然Lk,i={llk,i,j(Tij,k,uj)|j=1,2,…,C};
Figure BDA0002087603030000111
步骤5.5:对对数似然Lk,i降序排列,得到降序排列后的对数似然L′k,i,并将降序排列后的对数似然L′k,i中第一个值赋值给
Figure BDA0002087603030000112
将降序排列后的对数似然L′k,i中第二个值赋值给
Figure BDA0002087603030000113
其中,
Figure BDA0002087603030000114
表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j′类的稀疏逆协方差Θj′,k计算得到的对数似然值;
Figure BDA0002087603030000115
表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j″类的稀疏逆协方差Θj″,k计算得到的对数似然值。
步骤5.6:如果cj′=yi,则执行步骤5.9;否则,执行步骤5.7;
步骤5.7:将第k代中第yi类的稀疏逆协方差矩阵
Figure BDA00020876030300001115
赋值给第k代中第j类代表分类正确的逆协方差
Figure BDA0002087603030000116
将第k代中第j′类的稀疏逆协方差矩阵Θj′,k赋值给第k代中第j类代表分类错误的逆协方差
Figure BDA0002087603030000117
后,分别利用式(5)和式(6)计算更新后的第k代中第j类分类正确的逆协方差
Figure BDA0002087603030000118
以及更新后的第k代中第j类分类错误的逆协方差
Figure BDA0002087603030000119
Figure BDA00020876030300001110
Figure BDA00020876030300001111
步骤5.8:将更新后的第k代中第j类代表分类正确的逆协方差
Figure BDA00020876030300001112
赋值给第k代中第yi类逆协方差
Figure BDA00020876030300001113
将第k代中第j类代表分类错误的逆协方差
Figure BDA00020876030300001114
赋值给第k代中第j′类逆协方差Θj′,k,将i+1赋值给i,执行步骤5.4;
步骤5.9:如果
Figure BDA0002087603030000121
则将i+1赋值给i后,执行步骤5.4;否则,将第k代中第j′类逆协方差Θj′,k赋值给第k代中第j类代表分类正确的逆协方差
Figure BDA0002087603030000122
将将第k代中第j″类逆协方差Θj″,k赋值给第k代中第j类分类错误的逆协方差
Figure BDA0002087603030000123
后,执行步骤5.10;
步骤5.10:利用式(7)计算更新后的第k代中第j类代表分类正确的逆协方差
Figure BDA0002087603030000124
并赋值给Θj′,k,利用式(8)计算第k代中第j类代表分类错误的逆协方差
Figure BDA0002087603030000125
并赋值给Θj″,k后,将i+1赋值给i,并执行步骤5.4;
Figure BDA0002087603030000126
Figure BDA0002087603030000127
本实例中,应用LogDet散度对表5数据的多元高斯模型的稀疏协方差参数Θj,j=1,2,3,4进行优化,其优化结果如表6所示。
表5 Graphical Lasso求解多元高斯模型的稀疏协方差参数Θj,j=1,2,3,4
Figure BDA0002087603030000131
表6 LogDet散度优化求解多元高斯模型的稀疏逆协方差参数Θj,j=1,2,3,4
Figure BDA0002087603030000141
步骤6:对煤与瓦斯突出的测试样本进行预测:
步骤6.1:获取另一组煤与瓦斯突出数据作为测试样本,测试样本是由煤与瓦斯突出特征数据T′={T1′,T2′,…,Ti′′,…,TN′′}组成,其中,Ti′′表示测试样本中第i′条煤与瓦斯突出特征数据;i′∈[1,N′],N′表示测试样本的个数;
本实施例中,煤与瓦斯突出测试样本数据如表7所示,N′=4,T′={T1′,T2′,T3′,T4′}。
表7煤与瓦斯突出测试样本数据
Figure BDA0002087603030000151
步骤6.2:利用式(7)计算测试样本中第i′条煤与瓦斯突出特征数据Ti′′中第j类的对数似然lli′,j(Ti′′,Θj,uj),从而得到Ti′′与测试样本中所有类别的对数似然集合Li′={lli′,j(Ti′′,Θj,uj)|j=1,2,…,C};
Figure BDA0002087603030000152
步骤6.3:计算对数似然集合Li′中最大的对数似然值所对应的类别jmax=argmax{Li′},则jmax即为第i′条测试样本的分类标签。
表8煤与瓦斯突出测试样本数据的分类预测结果
Figure BDA0002087603030000153
本实施例中,根据式(7)得到表7中煤与瓦斯突出测试样本数据的分类预测结果,如表8所示。

Claims (1)

1.一种基于稀疏逆协方差的煤与瓦斯突出预测方法,其特征是按如下步骤进行:
步骤1:获取一组煤与瓦斯突出数据作为训练样本,所述训练样本是由煤与瓦斯突出特征数据T={T1,T2,…,Ti,…,TN}和分类标签数据Y={y1,y2,…,yi,···,yN}组成,其中,Ti表示第i条煤与瓦斯突出特征数据,且Ti=[Ti 1,Ti 2,…,Ti p...,Ti D],Ti p表示所述第i条煤与瓦斯突出特征数据Ti中第p维特征向量,且
Figure FDA0002821632050000011
Figure FDA0002821632050000012
为所述第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的第q个特征值;yi表示第i条煤与瓦斯突出特征数据Ti的分类标签,且yi={j|j=1,2,···,C}表示第j个分类标签,j∈[1,C],C表示分类标签的个数,i∈[1,N],N表示所述训练样本的个数,p∈[1,D],D为所述煤与瓦斯突出特征数据的维度,q∈[1,m],m为所述训练样本中第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的长度;
步骤2、对所述煤与瓦斯突出特征数据T按照分类标签进行划分,得到划分后的煤与瓦斯突出特征数据T″={XT1,XT2,…,XTj,…,XTC},其中,XTj表示第j类的所有煤与瓦斯突出特征数据集合,并有:
Figure FDA0002821632050000013
Figure FDA0002821632050000014
为属于所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量,并有:
Figure FDA0002821632050000015
其中,
Figure FDA0002821632050000016
是所述第p维特征向量
Figure FDA0002821632050000017
的第q′个时间点数据,q′∈[1,m′],m′为所述第p维特征向量
Figure FDA0002821632050000018
的长度;
步骤3:利用式(1)计算所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量
Figure FDA0002821632050000019
的均值μj,p,从而得到所述第j类的所有煤与瓦斯突出特征数据集合XTj的均值矩阵uj={μj,1j,2,…,μj,p,…μj,D};进而得到划分后的煤与瓦斯突出特征数据T″的均值矩阵U={u1,u2,…,uj,…,uC},
Figure FDA00028216320500000110
Figure FDA00028216320500000111
步骤4:利用式(2)计算所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量
Figure FDA00028216320500000112
和第p′维特征向量
Figure FDA00028216320500000113
的协方差
Figure FDA00028216320500000114
从而得到所述第j类的所有煤与瓦斯突出特征数据集合XTj的协方差矩阵
Figure FDA00028216320500000115
进而得到划分后的煤与瓦斯突出特征数据T″的协方差矩阵集合COV={COV1,COV2,…,COVj,…,COVC};
Figure FDA0002821632050000021
步骤5:求解代表划分后的煤与瓦斯突出数据集T″中每个分类标签的稀疏逆协方差矩阵集合Θ:
步骤5.1:定义当前迭代次数为k,并初始化k=0,定义最大迭代次数为maxIter,目标边界为ρ以及正则化参数为η;
步骤5.2:利用式(3)初始化第k代中第j类的稀疏逆协方差矩阵Θj,k,从而得到第k代稀疏逆协方差矩阵集合Θk={Θ1,k2,k,…,Θj,k,…,ΘC,k}:
Θj,k=GraphicalLasso(COVj) (3)
式(3)中:GraphicalLasso(·)表示图形套索Graphical Lasso的求解函数;
步骤5.3:如果k>maxIter,则将Θj,k赋值给Θj,从而得到稀疏逆协方差矩阵集合Θ={Θ12,…,Θj,…,ΘC};否则,初始化i=1;
步骤5.4:如果i>N,则将k+1赋值给k,并执行步骤5.3;否则,利用式(4)计算第k代中所述第i条煤与瓦斯突出特征数据Ti与第j类的稀疏逆协方差集合Θj,k以及均值矩阵uj的对数似然llk,i,j(Tij,k,uj),从而得到第k代中所述第i条煤与瓦斯突出特征数据Ti与每个类的稀疏逆协方差集合Θk以及均值矩阵U的对数似然Lk,i={llk,i,j(Tij,k,uj)|j=1,2,…,C};
Figure FDA0002821632050000022
步骤5.5:对所述对数似然Lk,i降序排列,得到降序排列后的对数似然L′k,i,并将降序排列后的对数似然L′k,i中第一个值赋值给
Figure FDA0002821632050000023
将降序排列后的对数似然L′k,i中第二个值赋值给
Figure FDA0002821632050000024
其中,
Figure FDA0002821632050000025
表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j′类的稀疏逆协方差Θj′,k计算得到的对数似然值;
Figure FDA0002821632050000026
表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j″类的稀疏逆协方差Θj″,k计算得到的对数似然值;
步骤5.6:如果cj′=yi,则执行步骤5.9;否则,执行步骤5.7;
步骤5.7:将第k代中第yi类的稀疏逆协方差矩阵
Figure FDA0002821632050000028
赋值给第k代中第j类代表分类正确的逆协方差
Figure FDA0002821632050000027
将第k代中第j′类的稀疏逆协方差矩阵Θj′,k赋值给第k代中第j类代表分类错误的逆协方差
Figure FDA0002821632050000031
后,分别利用式(5)和式(6)计算更新后的第k代中第j类分类正确的逆协方差
Figure FDA0002821632050000032
以及更新后的第k代中第j类分类错误的逆协方差
Figure FDA0002821632050000033
Figure FDA0002821632050000034
Figure FDA0002821632050000035
步骤5.8:将更新后的第k代中第j类代表分类正确的逆协方差
Figure FDA0002821632050000036
赋值给第k代中第yi类逆协方差
Figure FDA00028216320500000316
将第k代中第j类代表分类错误的逆协方差
Figure FDA0002821632050000037
赋值给第k代中第j′类逆协方差Θj′,k,将i+1赋值给i,执行步骤5.4;
步骤5.9:如果
Figure FDA0002821632050000038
则将i+1赋值给i后,执行步骤5.4;否则,将第k代中第j′类逆协方差Θj′,k赋值给第k代中第j类代表分类正确的逆协方差
Figure FDA0002821632050000039
将将第k代中第j″类逆协方差Θj″,k赋值给第k代中第j类分类错误的逆协方差
Figure FDA00028216320500000310
后,执行步骤5.10;
步骤5.10:利用式(7)计算更新后的第k代中第j类代表分类正确的逆协方差
Figure FDA00028216320500000311
并赋值给Θj′,k,利用式(8)计算第k代中第j类代表分类错误的逆协方差
Figure FDA00028216320500000312
并赋值给Θj″,k后,将i+1赋值给i,并执行步骤5.4;
Figure FDA00028216320500000313
Figure FDA00028216320500000314
步骤6:对煤与瓦斯突出的测试样本进行预测:
步骤6.1:获取另一组煤与瓦斯突出数据作为测试样本,所述测试样本是由煤与瓦斯突出特征数据T′={T1′,T2′,…,Ti′′,…,TN′′}组成,其中,Ti′′表示所述测试样本中第i′条煤与瓦斯突出特征数据;i′∈[1,N′],N′表示所述测试样本的个数;
步骤6.2:利用式(7)计算所述测试样本中第i′条煤与瓦斯突出特征数据Ti′′中第j类的对数似然lli′,j(Ti′′,Θj,uj),从而得到Ti′′与所述测试样本中所有类别的对数似然集合Li′={lli′,j(Ti′′,Θj,uj)|j=1,2,…,C};
Figure FDA00028216320500000315
步骤6.3:计算对数似然集合Li′中最大的对数似然值所对应的类别jmax=arg max{Li′},则jmax即为第i′条测试样本的分类标签。
CN201910492856.8A 2019-06-06 2019-06-06 一种基于稀疏逆协方差的煤与瓦斯突出预测方法 Active CN110222766B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910492856.8A CN110222766B (zh) 2019-06-06 2019-06-06 一种基于稀疏逆协方差的煤与瓦斯突出预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910492856.8A CN110222766B (zh) 2019-06-06 2019-06-06 一种基于稀疏逆协方差的煤与瓦斯突出预测方法

Publications (2)

Publication Number Publication Date
CN110222766A CN110222766A (zh) 2019-09-10
CN110222766B true CN110222766B (zh) 2021-03-30

Family

ID=67816020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910492856.8A Active CN110222766B (zh) 2019-06-06 2019-06-06 一种基于稀疏逆协方差的煤与瓦斯突出预测方法

Country Status (1)

Country Link
CN (1) CN110222766B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107436597A (zh) * 2017-07-17 2017-12-05 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017044945A1 (en) * 2015-09-10 2017-03-16 ADA-ES, Inc. Method and system to identify coal characteristics at the mine
CN106685427B (zh) * 2016-12-15 2019-11-15 华南理工大学 一种基于信息一致性的稀疏信号重构方法
CN107122861B (zh) * 2017-04-28 2020-02-11 辽宁工程技术大学 一种基于pca-pso-elm的瓦斯涌出量预测方法
CN107194524B (zh) * 2017-07-28 2020-05-22 合肥工业大学 一种基于rbf神经网络的煤与瓦斯突出预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107436597A (zh) * 2017-07-17 2017-12-05 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法

Also Published As

Publication number Publication date
CN110222766A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
Wu et al. Deep comprehensive correlation mining for image clustering
CN107194524B (zh) 一种基于rbf神经网络的煤与瓦斯突出预测方法
CN111898639B (zh) 基于降维的分层时间记忆工业异常检测方法与装置
CN111401573A (zh) 一种工况状态建模与修正模型方法
WO2024007580A1 (zh) 一种基于混合聚类的电力设备并行故障诊断方法及装置
CN115131618A (zh) 基于因果推理的半监督图像分类方法
CN114067915A (zh) 一种基于深度对抗变分自编码器的scRNA-seq数据降维方法
CN114863151B (zh) 一种基于模糊理论的图像降维聚类方法
CN107909062A (zh) 一种基于信息熵的遥感影像特征离散化方法及系统
CN108388918B (zh) 具有结构保持特性的数据特征选择方法
CN102968639A (zh) 基于局部线性回归的半监督图像聚类子空间学习算法
CN110222766B (zh) 一种基于稀疏逆协方差的煤与瓦斯突出预测方法
CN114328663A (zh) 一种基于数据挖掘的高维剧场数据降维可视化处理方法
CN113869136A (zh) 基于多分支网络的半监督极化sar图像分类方法
Fan et al. A Novel Ensemble Machine Learning Model for Oil Production Prediction with Two-Stage Data Preprocessing
CN116341929A (zh) 一种基于聚类和自适应梯度提升决策树的预测方法
CN110163437B (zh) 基于DPK-means的日前光伏发电功率预测方法
Li et al. (Retracted) Feature extraction method CNDFA for target contour of coal and gangue based on multifractal
Jingbo Big Data Classification Model and Algorithm Based on Double Quantum Particle Swarm Optimization
CN116484497A (zh) 一种基于多任务Transformer的过失速预测方法
CN115272798A (zh) 一种利用信息量扩充成矿预测训练正样本的方法及系统
CN109447309B (zh) 一种舞动数据的挖掘方法及系统
Zhul et al. A fast quantum clustering approach for cancer gene clustering
Wang D-self-SMOTE: New method for customer credit risk prediction based on self-training and smote
CN106933805B (zh) 一种大数据集中生物事件触发词的识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant