CN110222766B - 一种基于稀疏逆协方差的煤与瓦斯突出预测方法 - Google Patents
一种基于稀疏逆协方差的煤与瓦斯突出预测方法 Download PDFInfo
- Publication number
- CN110222766B CN110222766B CN201910492856.8A CN201910492856A CN110222766B CN 110222766 B CN110222766 B CN 110222766B CN 201910492856 A CN201910492856 A CN 201910492856A CN 110222766 B CN110222766 B CN 110222766B
- Authority
- CN
- China
- Prior art keywords
- coal
- gas outburst
- class
- inverse covariance
- characteristic data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003245 coal Substances 0.000 title claims abstract description 153
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 abstract description 3
- 238000007476 Maximum Likelihood Methods 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 9
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000005641 tunneling Effects 0.000 description 3
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 2
- 229910002091 carbon monoxide Inorganic materials 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000002817 coal dust Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2136—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于稀疏逆协方差的煤与瓦斯突出预测方法,其步骤包括:1、将煤与瓦斯突出数据处理成多变量时间序列数据;2、构建一种基于模型的方法来表征多变量煤与瓦斯突出时间序列数据;3、使用Graphical Lasso方法初始化煤与瓦斯突出数据集中每个类别的稀疏逆协方差;4、使用LogDet散度优化稀疏逆协方差;5、选择契合该模型的分类器——最大似然分类器对煤与瓦斯突出测试数据进行分类预测。本发明解决了煤与瓦斯突出数据的表示问题以及代表煤与瓦斯突出每个类别的逆协方差的稀疏性问题,从而能够快速且准确地对煤与瓦斯突出数据进行分类。
Description
技术领域
本发明涉及煤矿安全生产领域,具体是一种基于稀疏逆协方差的煤与瓦斯突出预测方法。
背景技术
煤炭是我国国民经济发展中的主体能源和重要原料,然而至今我国煤炭生产的安全形势却依然十分严峻。矿井的瓦斯、煤尘、火灾、水灾和顶板事故是煤矿的五大自然灾害,其中瓦斯是煤矿的头号“杀手”,而煤与瓦斯突出又是瓦斯灾害事故中发生频率高,伤害人数较多的典型动力灾害之一。因此,能够快速、准确的预测煤与瓦斯突出,不仅能提高煤矿生产的安全,而且也会产生巨大的经济效益和社会效益,具有重大的现实意义。
目前主要使用各种传感器监控煤与瓦斯突出,如甲烷传感器、一氧化碳传感器、温度传感器、风流压力传感器等,因而得到的数据都为时间序列数据。传统的预测煤与瓦斯突出的方法主要包括:单项指标法、综合指标法、钻屑瓦斯解吸指标法、R指标法等,这些预测方法仅仅考虑了影响煤与瓦斯突出的某个因素,而且预测指标的临界值的大小会随着不同地区不同矿井而有所不同,这些因素造成煤与瓦斯突出预测结果准确度不高。
近几年,先进的理论方法如计算机模拟、模糊数学理论、灰色系统理论、专家系统、分形理论、非线性理论、流变理论以及人工神经网络等已开始应用于煤与瓦斯突出的分析中,并取得了一定的研究成果。但上述这些方法需要对煤与瓦斯突出数据进行非常严格的处理,并且对煤与瓦斯突出的实时性预测较差。
直接对原始的未处理的煤与瓦斯突出数据进行分类,可大幅提高预测的实时性。而原始的未处理的煤与瓦斯突出数据即为多变量时间序列数据,其含义为多个传感器采集得到的时间序列数据集合。因此,对时间序列数据进行分类从而达到预测目的是一种非常可行且有效的方法。已有一些工作将多变量时间序列分类方法用于预测煤与瓦斯突出问题,但是由于传统多变量时间序列分类方法表征数据能力不强,分类过程计算效率低下以及分类准确率不高,导致该类方法在煤与瓦斯突出预测领域应用不够深入广泛。
发明内容
本发明为克服煤与瓦斯突出数据表征困难、计算效率低下以及预测准确率不高等现有技术存在的不足之处,提供一种基于稀疏逆协方差的煤与瓦斯突出预测方法,以期能快速准确地预测煤与瓦斯突出问题,并提高预测准确率和预测效率。
为了达到上述目的,本发明所采用的技术方案为:
本发明一种基于稀疏逆协方差的煤与瓦斯突出预测方法的特点是按如下步骤进行:
步骤1:获取一组煤与瓦斯突出数据作为训练样本,所述训练样本是由煤与瓦斯突出特征数据T={T1,T2,…,Ti,…,TN}和分类标签数据Y={y1,y2,…,yi,···,yN}组成,其中,Ti表示第i条煤与瓦斯突出特征数据,且Ti=[Ti 1,Ti 2,…,Ti p...,Ti D],Ti p表示所述第i条煤与瓦斯突出特征数据Ti中第p维特征向量,且 为所述第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的第q个特征值;yi表示第i条煤与瓦斯突出特征数据Ti的分类标签,且yi={j|j=1,2,···,C}表示第j个分类标签,j∈[1,C],C表示分类标签的个数,i∈[1,N],N表示所述训练样本的个数,p∈[1,D],D为所述煤与瓦斯突出特征数据的维度,q∈[1,m],m为所述训练样本中第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的长度;
步骤2、对所述煤与瓦斯突出特征数据T按照分类标签进行划分,得到划分后的煤与瓦斯突出特征数据T″={XT1,XT2,…,XTj,…,XTC},其中,XTj表示第j类的所有煤与瓦斯突出特征数据集合,并有: 为属于所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量,并有:其中,是所述第p维特征向量的第q′个时间点数据,q′∈[1,m′],m′为所述第p维特征向量的长度;
步骤3:利用式(1)计算所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量的均值μj,p,从而得到所述第j类的所有煤与瓦斯突出特征数据集合XTj的均值矩阵uj={μj,1,μj,2,…,μj,p,…μj,D};进而得到划分后的煤与瓦斯突出特征数据T″的均值矩阵U={u1,u2,…,uj,…,uC},
步骤4:利用式(2)计算所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量和第p′维特征向量的协方差从而得到所述第j类的所有煤与瓦斯突出特征数据集合XTj的协方差矩阵进而得到划分后的煤与瓦斯突出特征数据T″的协方差矩阵集合COV={COV1,COV2,…,COVj,…,COVC};
步骤5:求解代表划分后的煤与瓦斯突出数据集T″中每个分类标签的稀疏逆协方差矩阵集合Θ:
步骤5.1:定义当前迭代次数为k,并初始化k=0,定义最大迭代次数为maxIter,目标边界为ρ以及正则化参数为η;
步骤5.2:利用式(3)初始化第k代中第j类的稀疏逆协方差矩阵Θj,k,从而得到第k代稀疏逆协方差矩阵集合Θk={Θ1,k,Θ2,k,…,Θj,k,…,ΘC,k}:
Θj,k=GraphicalLasso(COVj) (3)
式(3)中:GraphicalLasso(·)表示图形套索Graphical Lasso的求解函数;
步骤5.3:如果k>maxIter,则将Θj,k赋值给Θj,从而得到稀疏逆协方差矩阵集合Θ={Θ1,Θ2,…,Θj,…,ΘC};否则,初始化i=1;
步骤5.4:如果i>N,则将k+1赋值给k,并执行步骤5.3;否则,利用式(4)计算第k代中所述第i条煤与瓦斯突出特征数据Ti与第j类的稀疏逆协方差集合Θj,k以及均值矩阵uj的对数似然llk,i,j(Ti,Θj,k,uj),从而得到第k代中所述第i条煤与瓦斯突出特征数据Ti与每个类的稀疏逆协方差集合Θk以及均值矩阵U的对数似然Lk,i={llk,i,j(Ti,Θj,k,uj)|j=1,2,…,C};
步骤5.5:对所述对数似然Lk,i降序排列,得到降序排列后的对数似然L′k,i,并将降序排列后的对数似然L′k,i中第一个值赋值给将降序排列后的对数似然L′k,i中第二个值赋值给其中,表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j′类的稀疏逆协方差Θj′,k计算得到的对数似然值;表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j″类的稀疏逆协方差Θj″,k计算得到的对数似然值;
步骤5.6:如果cj′=yi,则执行步骤5.9;否则,执行步骤5.7;
步骤5.7:将第k代中第yi类的稀疏逆协方差矩阵赋值给第k代中第j类代表分类正确的逆协方差将第k代中第j′类的稀疏逆协方差矩阵Θj′,k赋值给第k代中第j类代表分类错误的逆协方差后,分别利用式(5)和式(6)计算更新后的第k代中第j类分类正确的逆协方差以及更新后的第k代中第j类分类错误的逆协方差
步骤5.8:将更新后的第k代中第j类代表分类正确的逆协方差赋值给第k代中第yi类逆协方差将第k代中第j类代表分类错误的逆协方差赋值给第k代中第j′类逆协方差Θj′,k,将i+1赋值给i,执行步骤5.4;
步骤5.9:如果则将i+1赋值给i后,执行步骤5.4;否则,将第k代中第j′类逆协方差Θj′,k赋值给第k代中第j类代表分类正确的逆协方差将将第k代中第j″类逆协方差Θj″,k赋值给第k代中第j类分类错误的逆协方差后,执行步骤5.10;
步骤5.10:利用式(7)计算更新后的第k代中第j类代表分类正确的逆协方差并赋值给Θj′,k,利用式(8)计算第k代中第j类代表分类错误的逆协方差并赋值给Θj″,k后,将i+1赋值给i,并执行步骤5.4;
步骤6:对煤与瓦斯突出的测试样本进行预测:
步骤6.1:获取另一组煤与瓦斯突出数据作为测试样本,所述测试样本是由煤与瓦斯突出特征数据T′={T1′,T2′,…,Ti′′,…,TN′′}组成,其中,Ti′′表示所述测试样本中第i′条煤与瓦斯突出特征数据;i′∈[1,N′],N′表示所述测试样本的个数;
步骤6.2:利用式(7)计算所述测试样本中第i′条煤与瓦斯突出特征数据Ti′′中第j类的对数似然lli′,j(Ti′′,Θj,uj),从而得到Ti′′与所述测试样本中所有类别的对数似然集合Li′={lli′,j(Ti′′,Θj,uj)|j=1,2,…,C};
步骤6.3:计算对数似然集合Li′中最大的对数似然值所对应的类别jmax=argmax{Li′},则jmax即为所述第i′条测试样本的分类标签。
与已有技术相比,本发明的有益效果体现在:
1、本发明基于LogDet散度优化的稀疏逆协方差来表征煤与瓦斯突出数据,提高了模型的数据表征能力,从而提升了煤与瓦斯突出预测的准确度;
2、本发明中提出的预测模型直接对各个传感器实时采集得到的煤与瓦斯突出数据进行处理,相比传统技术需使用经过多步处理的数据而言,本发明极大提升了数据的实时利用率;并通过将计算所有煤与瓦斯突出数据的逆协方差转化为计算每个类别的逆协方差,降低了预测模型的计算量,从而提高了计算速度,并从数据利用及计算过程两方面保证了能够快速预测煤与瓦斯突出,达到了具有预测实时性的效果。
3、由于煤与瓦斯突出数据的高维性和大样本性,传统预测煤与瓦斯突出的方法容易产生过拟合现象,本发明中采用Graphical Lasso算法对表征煤与瓦斯突出数据集中每个类别的逆协方差进行稀疏化处理,提高了方法计算效率并避免了方法预测时的过拟合问题;同时,本发明针对煤与瓦斯突出预测存在的问题,构建了一种表征数据能力强、预测过程计算效率高且预测准确率高的多变量时间序列分类模型,用于将煤与瓦斯突出各影响因素和突出判据作为一个统一整体进行研究,能够定量描述各影响因素的作用和突出判据,从而能快速准确地预测煤与瓦斯突出问题,为煤与瓦斯突出的综合作用假说等形成机理提供实验依据。
附图说明
图1为本发明中基于稀疏逆协方差的煤与瓦斯突出预测方法的流程图;
图2为本发明中求解稀疏逆协方差的流程图。
具体实施方式
参照图1,本实施例中,一种基于稀疏逆协方差的煤与瓦斯突出预测方法是按如下步骤进行:
步骤1:获取一组煤与瓦斯突出数据作为训练样本。煤矿监控系统中的数据都是由传感器采集而来的,相应的,煤与瓦斯突出数据也是由众多传感器在不同时间段内采集得到的。因此煤与瓦斯突出数据具有多变量和时间属性,专业术语上称为多变量时间序列数据。本实施例中获取的一组训练样本是由煤与瓦斯突出特征数据T={T1,T2,…,Ti,…,TN}和分类标签数据Y={y1,y2,…,yi,···,yN}组成,其中,Ti表示第i条煤与瓦斯突出特征数据,且Ti=[Ti 1,Ti 2,…,Ti p...,Ti D],Ti p表示第i条煤与瓦斯突出特征数据Ti中第p维特征向量,且 为第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的第q个特征值;yi表示第i条煤与瓦斯突出特征数据Ti的分类标签,且yi={j|j=1,2,···,C}表示第j个分类标签,j∈[1,C],C表示分类标签的个数,i∈[1,N],N表示训练样本的个数,p∈[1,D],D为煤与瓦斯突出特征数据的维度,q∈[1,m],m为训练样本中第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的长度;
本实施例中,以表1中的煤与瓦斯突出训练样本数据(由Python自带的preprocessing.MinMaxScaler函数实现归一化)为例,其中煤与瓦斯突出样本个数N=8,每个训练样本的大小m1=m2=…=m8=4,煤与瓦斯突出样本类别个数C=4,y1=1,y2=2,y3=3,y4=4。这组煤与瓦斯突出训练样本数据由12个传感器采集得到,因此D=12,其中D1为烟雾传感器传感器、D2为采煤工作面回风巷传感器、D3采煤工作面进风巷传感器、D4为掘进工作面采区回风巷甲烷传感器、D5掘进工作面一翼回风巷甲烷传感器、D6掘进工作面总回风巷测风站甲烷传感器、D7为一氧化碳传感器、D8为风速传感器、D9为风压传感器、D10为瓦斯抽放管路流量传感器、D11为瓦斯抽放管路温度传感器、D12为瓦斯抽放管路压力传感器。
表1原始煤与瓦斯突出时间序列训练样本数据
步骤2、对煤与瓦斯突出特征数据T按照分类标签进行划分,得到划分后的煤与瓦斯突出特征数据T″={XT1,XT2,…,XTj,…,XTC},其中,XTj表示第j类的所有煤与瓦斯突出特征数据集合,并有: 为属于第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量,并有:其中,是第p维特征向量的第q′个时间点数据,q′∈[1,m′],m′为第p维特征向量的长度;
合并同类别的所有煤与瓦斯突出特征数据,得到表2的煤与瓦斯突出训练样本数据。因此,T″={XT1,XT2,XT3,XT4}。
表2合并同类别后的煤与瓦斯突出训练样本数据
步骤3:利用式(1)计算第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量的均值μj,p,从而得到第j类的所有煤与瓦斯突出特征数据集合XTj的均值矩阵uj={μj,1,μj,2,…,μj,p,…μj,D};进而得到划分后的煤与瓦斯突出特征数据T″的均值矩阵U={u1,u2,…,uj,…,uC},如图2所示,具体按如下步骤进行:
本实施例中,对表2合并同类别后的煤与瓦斯突出训练样本数据求解多元高斯模型的均值参数U={u1,u2,u3,u4},用Python软件自带的均值求解函数mean()对12维的时间序列数据进行均值求解,求解结果如表3所示。
表3煤与瓦斯突出数据的多元高斯模型的均值参数U={u1,u2,u3,u4}
u<sub>1</sub> | 1.523004 | -0.44643 | 0.3124 | -0.03621 | 0.115016 | -0.12929 | -0.21178 | -0.08185 | -0.11929 | -0.20939 | -0.12193 | 0.071331 |
u<sub>2</sub> | 0.974744 | -0.97114 | 0.246467 | -0.29719 | 0.194719 | -0.15545 | -0.28019 | -0.07003 | -0.1665 | -0.24191 | -0.09362 | 0.133167 |
u<sub>3</sub> | 0.428688 | -0.2348 | 0.061563 | -0.37914 | 0.195163 | -0.41358 | 0.056015 | -0.07356 | -0.31409 | -0.13399 | 0.018616 | 0.111583 |
u<sub>4</sub> | 0.687517 | -0.82506 | 0.316253 | -0.42229 | -0.06324 | -0.08093 | -0.22819 | -0.13748 | -0.06799 | -0.25847 | -0.06736 | 0.21793 |
步骤4:利用式(2)计算第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量和第p′维特征向量的协方差从而得到第j类的所有煤与瓦斯突出特征数据集合XTj的协方差矩阵进而得到划分后的煤与瓦斯突出特征数据T″的协方差矩阵集合COV={COV1,COV2,…,COVj,…,COVC};
本实施例中,对表2合并同类别后的煤与瓦斯突出训练样本数据求解多元高斯模型的协方差参数COVj,j=1,2,3,4,如表4所示。
表4煤与瓦斯突出数据的多元高斯模型的协方差参数COVj,j=1,2,3,4
步骤5:求解代表划分后的煤与瓦斯突出数据集T″中每个分类标签的稀疏逆协方差矩阵集合Θ:
步骤5.1:定义当前迭代次数为k,并初始化k=0,定义最大迭代次数为maxIter,目标边界为ρ以及正则化参数为η;
步骤5.2:利用式(3)初始化第k代中第j类的稀疏逆协方差矩阵Θj,k,从而得到第k代稀疏逆协方差矩阵集合Θk={Θ1,k,Θ2,k,…,Θj,k,…,ΘC,k}:
Θj,k=GraphicalLasso(COVj) (3)
式(3)中:GraphicalLasso(·)表示图形套索Graphical Lasso的求解函数;
步骤5.3:如果k>maxIter,则将Θj,k赋值给Θj,从而得到稀疏逆协方差矩阵集合Θ={Θ1,Θ2,…,Θj,…,ΘC};否则,初始化i=1;
步骤5.4:如果i>N,则将k+1赋值给k,并执行步骤5.3;否则,利用式(4)计算第k代中第i条煤与瓦斯突出特征数据Ti与第j类的稀疏逆协方差集合Θj,k以及均值矩阵uj的对数似然llk,i,j(Ti,Θj,k,uj),从而得到第k代中第i条煤与瓦斯突出特征数据Ti与每个类的稀疏逆协方差集合Θk以及均值矩阵U的对数似然Lk,i={llk,i,j(Ti,Θj,k,uj)|j=1,2,…,C};
步骤5.5:对对数似然Lk,i降序排列,得到降序排列后的对数似然L′k,i,并将降序排列后的对数似然L′k,i中第一个值赋值给将降序排列后的对数似然L′k,i中第二个值赋值给其中,表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j′类的稀疏逆协方差Θj′,k计算得到的对数似然值;表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j″类的稀疏逆协方差Θj″,k计算得到的对数似然值。
步骤5.6:如果cj′=yi,则执行步骤5.9;否则,执行步骤5.7;
步骤5.7:将第k代中第yi类的稀疏逆协方差矩阵赋值给第k代中第j类代表分类正确的逆协方差将第k代中第j′类的稀疏逆协方差矩阵Θj′,k赋值给第k代中第j类代表分类错误的逆协方差后,分别利用式(5)和式(6)计算更新后的第k代中第j类分类正确的逆协方差以及更新后的第k代中第j类分类错误的逆协方差
步骤5.8:将更新后的第k代中第j类代表分类正确的逆协方差赋值给第k代中第yi类逆协方差将第k代中第j类代表分类错误的逆协方差赋值给第k代中第j′类逆协方差Θj′,k,将i+1赋值给i,执行步骤5.4;
步骤5.9:如果则将i+1赋值给i后,执行步骤5.4;否则,将第k代中第j′类逆协方差Θj′,k赋值给第k代中第j类代表分类正确的逆协方差将将第k代中第j″类逆协方差Θj″,k赋值给第k代中第j类分类错误的逆协方差后,执行步骤5.10;
步骤5.10:利用式(7)计算更新后的第k代中第j类代表分类正确的逆协方差并赋值给Θj′,k,利用式(8)计算第k代中第j类代表分类错误的逆协方差并赋值给Θj″,k后,将i+1赋值给i,并执行步骤5.4;
本实例中,应用LogDet散度对表5数据的多元高斯模型的稀疏协方差参数Θj,j=1,2,3,4进行优化,其优化结果如表6所示。
表5 Graphical Lasso求解多元高斯模型的稀疏协方差参数Θj,j=1,2,3,4
表6 LogDet散度优化求解多元高斯模型的稀疏逆协方差参数Θj,j=1,2,3,4
步骤6:对煤与瓦斯突出的测试样本进行预测:
步骤6.1:获取另一组煤与瓦斯突出数据作为测试样本,测试样本是由煤与瓦斯突出特征数据T′={T1′,T2′,…,Ti′′,…,TN′′}组成,其中,Ti′′表示测试样本中第i′条煤与瓦斯突出特征数据;i′∈[1,N′],N′表示测试样本的个数;
本实施例中,煤与瓦斯突出测试样本数据如表7所示,N′=4,T′={T1′,T2′,T3′,T4′}。
表7煤与瓦斯突出测试样本数据
步骤6.2:利用式(7)计算测试样本中第i′条煤与瓦斯突出特征数据Ti′′中第j类的对数似然lli′,j(Ti′′,Θj,uj),从而得到Ti′′与测试样本中所有类别的对数似然集合Li′={lli′,j(Ti′′,Θj,uj)|j=1,2,…,C};
步骤6.3:计算对数似然集合Li′中最大的对数似然值所对应的类别jmax=argmax{Li′},则jmax即为第i′条测试样本的分类标签。
表8煤与瓦斯突出测试样本数据的分类预测结果
本实施例中,根据式(7)得到表7中煤与瓦斯突出测试样本数据的分类预测结果,如表8所示。
Claims (1)
1.一种基于稀疏逆协方差的煤与瓦斯突出预测方法,其特征是按如下步骤进行:
步骤1:获取一组煤与瓦斯突出数据作为训练样本,所述训练样本是由煤与瓦斯突出特征数据T={T1,T2,…,Ti,…,TN}和分类标签数据Y={y1,y2,…,yi,···,yN}组成,其中,Ti表示第i条煤与瓦斯突出特征数据,且Ti=[Ti 1,Ti 2,…,Ti p...,Ti D],Ti p表示所述第i条煤与瓦斯突出特征数据Ti中第p维特征向量,且 为所述第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的第q个特征值;yi表示第i条煤与瓦斯突出特征数据Ti的分类标签,且yi={j|j=1,2,···,C}表示第j个分类标签,j∈[1,C],C表示分类标签的个数,i∈[1,N],N表示所述训练样本的个数,p∈[1,D],D为所述煤与瓦斯突出特征数据的维度,q∈[1,m],m为所述训练样本中第i条煤与瓦斯突出特征数据Ti中第p维特征向量Ti p的长度;
步骤2、对所述煤与瓦斯突出特征数据T按照分类标签进行划分,得到划分后的煤与瓦斯突出特征数据T″={XT1,XT2,…,XTj,…,XTC},其中,XTj表示第j类的所有煤与瓦斯突出特征数据集合,并有: 为属于所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量,并有:其中,是所述第p维特征向量的第q′个时间点数据,q′∈[1,m′],m′为所述第p维特征向量的长度;
步骤3:利用式(1)计算所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量的均值μj,p,从而得到所述第j类的所有煤与瓦斯突出特征数据集合XTj的均值矩阵uj={μj,1,μj,2,…,μj,p,…μj,D};进而得到划分后的煤与瓦斯突出特征数据T″的均值矩阵U={u1,u2,…,uj,…,uC},
步骤4:利用式(2)计算所述第j类的所有煤与瓦斯突出特征数据集合XTj中第p维特征向量和第p′维特征向量的协方差从而得到所述第j类的所有煤与瓦斯突出特征数据集合XTj的协方差矩阵进而得到划分后的煤与瓦斯突出特征数据T″的协方差矩阵集合COV={COV1,COV2,…,COVj,…,COVC};
步骤5:求解代表划分后的煤与瓦斯突出数据集T″中每个分类标签的稀疏逆协方差矩阵集合Θ:
步骤5.1:定义当前迭代次数为k,并初始化k=0,定义最大迭代次数为maxIter,目标边界为ρ以及正则化参数为η;
步骤5.2:利用式(3)初始化第k代中第j类的稀疏逆协方差矩阵Θj,k,从而得到第k代稀疏逆协方差矩阵集合Θk={Θ1,k,Θ2,k,…,Θj,k,…,ΘC,k}:
Θj,k=GraphicalLasso(COVj) (3)
式(3)中:GraphicalLasso(·)表示图形套索Graphical Lasso的求解函数;
步骤5.3:如果k>maxIter,则将Θj,k赋值给Θj,从而得到稀疏逆协方差矩阵集合Θ={Θ1,Θ2,…,Θj,…,ΘC};否则,初始化i=1;
步骤5.4:如果i>N,则将k+1赋值给k,并执行步骤5.3;否则,利用式(4)计算第k代中所述第i条煤与瓦斯突出特征数据Ti与第j类的稀疏逆协方差集合Θj,k以及均值矩阵uj的对数似然llk,i,j(Ti,Θj,k,uj),从而得到第k代中所述第i条煤与瓦斯突出特征数据Ti与每个类的稀疏逆协方差集合Θk以及均值矩阵U的对数似然Lk,i={llk,i,j(Ti,Θj,k,uj)|j=1,2,…,C};
步骤5.5:对所述对数似然Lk,i降序排列,得到降序排列后的对数似然L′k,i,并将降序排列后的对数似然L′k,i中第一个值赋值给将降序排列后的对数似然L′k,i中第二个值赋值给其中,表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j′类的稀疏逆协方差Θj′,k计算得到的对数似然值;表示第k次迭代中第i条煤与瓦斯突出特征数据Ti与第j″类的稀疏逆协方差Θj″,k计算得到的对数似然值;
步骤5.6:如果cj′=yi,则执行步骤5.9;否则,执行步骤5.7;
步骤5.7:将第k代中第yi类的稀疏逆协方差矩阵赋值给第k代中第j类代表分类正确的逆协方差将第k代中第j′类的稀疏逆协方差矩阵Θj′,k赋值给第k代中第j类代表分类错误的逆协方差后,分别利用式(5)和式(6)计算更新后的第k代中第j类分类正确的逆协方差以及更新后的第k代中第j类分类错误的逆协方差
步骤5.8:将更新后的第k代中第j类代表分类正确的逆协方差赋值给第k代中第yi类逆协方差将第k代中第j类代表分类错误的逆协方差赋值给第k代中第j′类逆协方差Θj′,k,将i+1赋值给i,执行步骤5.4;
步骤5.9:如果则将i+1赋值给i后,执行步骤5.4;否则,将第k代中第j′类逆协方差Θj′,k赋值给第k代中第j类代表分类正确的逆协方差将将第k代中第j″类逆协方差Θj″,k赋值给第k代中第j类分类错误的逆协方差后,执行步骤5.10;
步骤5.10:利用式(7)计算更新后的第k代中第j类代表分类正确的逆协方差并赋值给Θj′,k,利用式(8)计算第k代中第j类代表分类错误的逆协方差并赋值给Θj″,k后,将i+1赋值给i,并执行步骤5.4;
步骤6:对煤与瓦斯突出的测试样本进行预测:
步骤6.1:获取另一组煤与瓦斯突出数据作为测试样本,所述测试样本是由煤与瓦斯突出特征数据T′={T1′,T2′,…,Ti′′,…,TN′′}组成,其中,Ti′′表示所述测试样本中第i′条煤与瓦斯突出特征数据;i′∈[1,N′],N′表示所述测试样本的个数;
步骤6.2:利用式(7)计算所述测试样本中第i′条煤与瓦斯突出特征数据Ti′′中第j类的对数似然lli′,j(Ti′′,Θj,uj),从而得到Ti′′与所述测试样本中所有类别的对数似然集合Li′={lli′,j(Ti′′,Θj,uj)|j=1,2,…,C};
步骤6.3:计算对数似然集合Li′中最大的对数似然值所对应的类别jmax=arg max{Li′},则jmax即为第i′条测试样本的分类标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910492856.8A CN110222766B (zh) | 2019-06-06 | 2019-06-06 | 一种基于稀疏逆协方差的煤与瓦斯突出预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910492856.8A CN110222766B (zh) | 2019-06-06 | 2019-06-06 | 一种基于稀疏逆协方差的煤与瓦斯突出预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110222766A CN110222766A (zh) | 2019-09-10 |
CN110222766B true CN110222766B (zh) | 2021-03-30 |
Family
ID=67816020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910492856.8A Active CN110222766B (zh) | 2019-06-06 | 2019-06-06 | 一种基于稀疏逆协方差的煤与瓦斯突出预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110222766B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107436597A (zh) * | 2017-07-17 | 2017-12-05 | 华南理工大学 | 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017044945A1 (en) * | 2015-09-10 | 2017-03-16 | ADA-ES, Inc. | Method and system to identify coal characteristics at the mine |
CN106685427B (zh) * | 2016-12-15 | 2019-11-15 | 华南理工大学 | 一种基于信息一致性的稀疏信号重构方法 |
CN107122861B (zh) * | 2017-04-28 | 2020-02-11 | 辽宁工程技术大学 | 一种基于pca-pso-elm的瓦斯涌出量预测方法 |
CN107194524B (zh) * | 2017-07-28 | 2020-05-22 | 合肥工业大学 | 一种基于rbf神经网络的煤与瓦斯突出预测方法 |
-
2019
- 2019-06-06 CN CN201910492856.8A patent/CN110222766B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107436597A (zh) * | 2017-07-17 | 2017-12-05 | 华南理工大学 | 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110222766A (zh) | 2019-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Deep comprehensive correlation mining for image clustering | |
CN107194524B (zh) | 一种基于rbf神经网络的煤与瓦斯突出预测方法 | |
CN111898639B (zh) | 基于降维的分层时间记忆工业异常检测方法与装置 | |
CN111401573A (zh) | 一种工况状态建模与修正模型方法 | |
WO2024007580A1 (zh) | 一种基于混合聚类的电力设备并行故障诊断方法及装置 | |
CN115131618A (zh) | 基于因果推理的半监督图像分类方法 | |
CN114067915A (zh) | 一种基于深度对抗变分自编码器的scRNA-seq数据降维方法 | |
CN114863151B (zh) | 一种基于模糊理论的图像降维聚类方法 | |
CN107909062A (zh) | 一种基于信息熵的遥感影像特征离散化方法及系统 | |
CN108388918B (zh) | 具有结构保持特性的数据特征选择方法 | |
CN102968639A (zh) | 基于局部线性回归的半监督图像聚类子空间学习算法 | |
CN110222766B (zh) | 一种基于稀疏逆协方差的煤与瓦斯突出预测方法 | |
CN114328663A (zh) | 一种基于数据挖掘的高维剧场数据降维可视化处理方法 | |
CN113869136A (zh) | 基于多分支网络的半监督极化sar图像分类方法 | |
Fan et al. | A Novel Ensemble Machine Learning Model for Oil Production Prediction with Two-Stage Data Preprocessing | |
CN116341929A (zh) | 一种基于聚类和自适应梯度提升决策树的预测方法 | |
CN110163437B (zh) | 基于DPK-means的日前光伏发电功率预测方法 | |
Li et al. | (Retracted) Feature extraction method CNDFA for target contour of coal and gangue based on multifractal | |
Jingbo | Big Data Classification Model and Algorithm Based on Double Quantum Particle Swarm Optimization | |
CN116484497A (zh) | 一种基于多任务Transformer的过失速预测方法 | |
CN115272798A (zh) | 一种利用信息量扩充成矿预测训练正样本的方法及系统 | |
CN109447309B (zh) | 一种舞动数据的挖掘方法及系统 | |
Zhul et al. | A fast quantum clustering approach for cancer gene clustering | |
Wang | D-self-SMOTE: New method for customer credit risk prediction based on self-training and smote | |
CN106933805B (zh) | 一种大数据集中生物事件触发词的识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |