CN111275003B - 基于类最优高斯核多分类支持向量机的微震信号识别方法 - Google Patents
基于类最优高斯核多分类支持向量机的微震信号识别方法 Download PDFInfo
- Publication number
- CN111275003B CN111275003B CN202010101031.1A CN202010101031A CN111275003B CN 111275003 B CN111275003 B CN 111275003B CN 202010101031 A CN202010101031 A CN 202010101031A CN 111275003 B CN111275003 B CN 111275003B
- Authority
- CN
- China
- Prior art keywords
- microseismic
- class
- data
- support vector
- vector machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 63
- 238000012549 training Methods 0.000 claims abstract description 44
- 230000009467 reduction Effects 0.000 claims abstract description 24
- 239000011435 rock Substances 0.000 claims abstract description 21
- 239000000523 sample Substances 0.000 claims description 128
- 238000005070 sampling Methods 0.000 claims description 33
- 238000001514 detection method Methods 0.000 claims description 29
- 238000012544 monitoring process Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 230000008030 elimination Effects 0.000 claims description 5
- 238000003379 elimination reaction Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000002474 experimental method Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000009977 dual effect Effects 0.000 abstract description 2
- 239000003245 coal Substances 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 8
- 238000005065 mining Methods 0.000 description 5
- 238000007477 logistic regression Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000002360 explosive Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V1/00—Seismology; Seismic or acoustic prospecting or detecting
- G01V1/28—Processing seismic data, e.g. for interpretation or for event detection
- G01V1/288—Event detection in seismic signals, e.g. microseismics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/30—Assessment of water resources
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Environmental & Geological Engineering (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- Geology (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geophysics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
一种基于类最优高斯核多分类支持向量机的微震信号识别方法,属于机器学习与数据挖掘领域。首先,对微震数据按照信道划分,并进行数据格式转换;其次,对每个信道数据根据均值和方差进行特征提取,并将同一样本的所有信道合并,构成新特征,利用类最优高斯核多分类支持向量机,对合成数据进行特征选择,生成降维后的非平衡训练样本集;再次,根据训练样本的非平衡率,确定欠采样倍率,对大类样本进行欠采样;最后,采用多分类支持向量机构建降维后的微震信号分类器。本发明可以有效减少冗余特征对分类的影响;通过对信道特征和合并特征进行双重降维,有效降低微震信号维度,提高微震信号分类器的正确率和时效性,增加冲击地压灾害预警的准确率。
Description
技术领域
本发明涉及一种微震信号识别方法,特别是一种基于类最优高斯核多分类支持向量机的微震信号识别方法,属于机器学习与数据挖掘领域。
背景技术
冲击地压是一种典型的煤矿动力灾害,严重威胁煤矿的高效生产和人员安全,因此,对冲击地压灾害的预警至关重要。冲击地压指在高应力作用下,聚集的能量突然释放,对煤岩体造成冲击,导致人员伤亡,建筑物破坏的现象。微震是采矿活动诱发的微地震,是煤岩介质在矿区应力作用下,聚集的弹性应变能突然释放,造成采掘空间周围岩体破裂的现象。因此,通过对微震信号分类,可以有效识别煤岩体状态,逐渐成为冲击地压预警的一种有效手段。
目前,微震信号数据识别的方法主要有时频分析和机器学习方法两类。其中,时频分析能有效分析微震波形频谱特征。常用的时频分析方法包括傅里叶变换、小波变换、小波包变换和频率切片小波变换,等。文献(曹安业,窦林名,秦玉红,等.高应力区微震监测信号特征分析[J].采矿与安全工程学报,2007,24(2):146-149.)利用傅里叶变换,得到矿山微震信号的幅频特征,为煤矿微震信号的初步辨识提供依据。文献(唐守锋,童敏明,潘玉祥,等.煤岩破裂微震信号的小波特征能谱系数分析法[J].仪器仪表学报,2011,32(7):1521-1527.)分析了微震信号与噪声信号的能量分布特征,提出采用小波能谱系数的方法,提取微震信号的特征信息。文献(赵国彦,邓青林,马举.基于时频分析的矿山微震信号分析与识别[J].岩土工程学报,2015,37(2):306-312.)采用频率切片小波变换,识别煤矿微震信号。
时频域分析方法虽然可以有效分析煤矿微震信号频谱的特性,但是,由于每个传感器产生的数据量规模巨大,所以现场实时应用存在一定难度。因此,结合机器学习和计算机技术,实现大规模微震数据处理成为微震数据分析的一种新兴有效方法。文献(朱权洁,姜福兴,尹永明,等.基于小波分形特征与模式识别的矿山微震波形识别研究[J].岩土工程学报,2012,34(11):2036-2042.)将小波包与分形相结合,提取微震信号特征,并采用支持向量机实现微震信号分类。文献(Vallejos J A,Mckinnon S D.Logistic regression andneural network classification of seismic records[J].Inernational Journal ofRock Mechanics&Mining Sciences,2013,62(9):86-95.)应用逻辑回归和人工神经网络,对微震信号和爆炸信号实现分类。文献(Dong L,Wesseloo J,Potvin Y,etal.Discrimination of Mine Seismic Events and Blasts Using the FisherClassifier, Bayesian Classifier and Logistic Regression[J].RockMechanics and Rock Engineering,2016,49(1):183-211.)采用Fisher分类器、朴素贝叶斯分类器和逻辑回归,分析矿山微震和爆炸事件发生的可能性。
目前,微震信号的识别主要存在以下不足煤矿微震信号受背景噪音、机械振动等环境因素影响,信噪比低,不同微震信号采集点获取的微震数据存在一定不平衡性,已有的微震监测系统存在自动识别效果差、分类准确率低且不稳定等问题。鉴于此,设计一种准确有效的煤矿冲击地压微震信号数据识别方法,对煤矿冲击地压灾害的监测及预警具有重要意义。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于类最优高斯核多分类支持向量机的微震信号识别方法,解决微震信号在分类识别中存在的数据量过大,存在数据特征冗余,信噪比低和样本之间非平衡的问题;实现快速准确地识别微震信号数据,节约计算资源,提高反应速度。
技术方案:为实现上述目的,本发明采用的技术方案为:微震信号识别方法,通过特征选择选择的方式实现对微震信号的降维,从而提高微震信号的分类速度及准确率,能够快速准确地预警冲击地压灾害;首先,对微震数据进行数据格式转换,并且对每个数据样本按照信道进行划分;其次,对每个信道的数据利用求取均值和方差的方式进行特征提取,并将同一样本的所有信道进行合并,构成新的特征,利用类最优高斯核多分类支持向量机对合成后的数据进行特征选择,生成降维后的非平衡训练样本集;再次,根据训练样本的非平衡率,确定欠采样倍率,对大类样本进行欠采样;最后,采用多分类支持向量机构建降维后的微震信号分类器。
微震信号识别方法,包括以下步骤:
步骤1)通过微震监测系统采集微震数据并进行数据预处理,按照时间窗大小,划分微震监测数据集;
步骤2)根据步骤1时间窗大小划分微震监测数据集,得到时间窗内各个微震检波测量探头所采集的微震信号,每个探头采集到的信号划分为一个信道,对每个信道采集到的信号求取均值和方差,作为该信道的特征,并对同一样本的所有信道特征,按照顺序进行合并构成样本特征,构建特征提取后的非平衡训练样本集;
步骤3)根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集;
步骤4)根据步骤3获得的平衡训练样本集,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的训练样本集;
步骤5)利用多分类支持向量机,构建降维后的微震信号分类学习器;
步骤6)基于MATLAB软件平台,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
优选的:所述步骤1中,对SOS微震监测系统采集获得的微震数据以.w格式保存;采用专用软件SEISGR通过二进制流方式,将其格式转换为.asc格式的可读数据;进而,基于MATLAB软件平台,再将其转换为.csv格式的微震数据。
优选的:所述步骤1中,按照时间窗大小划分微震检测数据集的方法:将转化格式后的微震数据,按照时间窗T,分割为[tmax/T]组采样数据,其中,tmax为采样微震数据的最大采样时间,T为时间窗大小。
优选的:所述步骤2中,信道特征合成为样本特征的方法:
步骤21)记为第k组采样数据中第n个微震检波测量探头在第t个采样时刻获得的微震信号,其中,n=1,2,…,N,t=1,2,…,T,k=1,2,…,K,N为微震检波测量探头个数,K为采样数据集规模;根据每组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的空间距离d(on,z)=‖on-z‖2,计算该组微震监测信号的能量值ek,记为:
ek=λ(rk)q
其中,q和λ为预先设定的常数,on和z分别为微震检波测量探头的空间位置和微震震源的空间位置,则:
其中,rk表示第k组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的最大空间距离;
步骤22)以104J为能量分界点,满足ek≤104J的微震信号,标记为弱微震信号,即yk=1;满足ek>104J的微震信号,标记为强微震信号,即yk=2;
步骤23)针对第k组采样数据,计算每个微震检波测量探头在时间窗内所采集微震信号的均值和方差/>分别为:
步骤24)针对第k组采样数据,根据所求均值和方差构建新的采样数据特征:
其中,m=2N,为第k组采样数据的特征数;特征提取后的大类样本集S0={(xi,yi)|xi=si,yi=1},小类样本S2={(xi,yi)|xi=si,yi=2}。
优选的:所述步骤3中,根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集的方法:确定各类样本的样本数目,根据样本数目对大类样本随机进行舍弃,直至大类中包含的样本数目与小类相当,形成新的平衡样本集S1={(xi,yi)|xi=si,yi=1},S2={(xi,yi)|xi=si,yi=2},i=1,2…,M,为平衡样本集的样本个数。
优选的:所述步骤4中,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的降维训练样本集的方法:
步骤41)根据平衡样本集,构建类最优高斯核多分类支持向量机,其目标函数为:
ξic≥0,i=1,2,…,M
其中,ω为权重向量,b为偏置量,ф(xi)为高斯核函数映射,映射方式为:
di为描述不同样本与超平面之间距离的松弛变量;记为距离矩阵中的元素,c1为超平面类别,c2为样本类别,依次计算所有类别的超平面,根据当前超平面和样本的类别在距离矩阵中选取对应的di值;样本类别和超平面类别的距离矩阵为:
其中,为每两类样本之间的样本中心距离,/>为每一类样本的样本中心,mc为第c类样本的总数;
步骤42)利用拉格朗日乘子法对类最优高斯核多分类支持向量机的目标函数进行求解,可得权重向量为:
步骤43)根据权重向量对样本特征进行评分,评分标准为:
其中,f=1,2…,m,(-p)表示第p个特征被移除;
步骤44)按照特征评分标准,对所有的特征进行评分,然后将所有的特征平分为两部分,对每一部分的特征评分进行加和,移除评分较低的部分,之后重复上述步骤,直到剩余特征数为重要特征数h的二倍为止;对剩余的特征按照特征评分标准进行评分,并按照评分的大小进行排序,移除评分最小的特征,之后重复上述步骤,直到剩余特征数为重要特征数h为止;
步骤45)对于移除的特征,将其划分为包含特征数为l的若干份重筛选特征,将每一份重筛选特征拼接到重要特征后,构成特征数为h+l的样本集,利用多分类支持向量机进行分类,保留分类效果最好的重筛选特征,最终构成降维后的训练样本集。
优选的:所述步骤5)中,利用多分类支持向量机,构建降维后的微震信号分类学习器的方法:将降维后的训练样本(xi,yi)作为多分类支持向量机的输入,实现对分类学习器的训练。
优选的:所述步骤6)中,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性的方法:
首先,基于MATLAB软件平台,构建基于类最优高斯核多分类支持向量机的微震信号识别方法;
其次,确定所提方法中的关键参数取值,包括多分类支持向量机的训练准确率和模型复杂度间的平衡常数C,高斯核函数的核参数σ,以及每个样本所选取的重要特征数h和重筛选特征数l;
最后,实验验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
本发明相比现有技术,具有以下有益效果及优点:
本发明适用于对煤矿微震信号的分类识别,解决了微震信号在分类识别中存在的数据量过大,存在数据特征冗余,信噪比低和样本之间非平衡的问题;提出的基于类最优高斯核多分类支持向量机的微震信号识别方法,一方面,利用特征提取的方式对高维度低信噪比的微震信号进行初步降维,大幅降低计算复杂度,提高识别速度;另一方面,利用类最优高斯核多分类支持向量机,对数据进一步降维,去除冗余特征,提高分类准确率,为精确识别冲击地压灾害及时有效预警提供更有力的支持。
附图说明
图1是本发明实施例的分类识别准确率图
具体实施方式
基于类最优高斯核多分类支持向量机的微震信号识别方法,用于实现微震信号的分类,完成对冲击地压灾害更加准确及时的预警。
通过特征选择选择的方式实现对微震信号的降维,从而提高微震信号的分类速度及准确率,能够快速准确地预警冲击地压灾害。首先,对微震数据进行数据格式转换,并且对每个数据样本按照信道进行划分;其次,对每个信道的数据利用求取均值和方差的方式进行特征提取,并将同一样本的所有信道进行合并,构成新的特征,利用类最优高斯核多分类支持向量机对合成后的数据进行特征选择,生成降维后的非平衡训练样本集;再次,根据训练样本的非平衡率,确定欠采样倍率,对大类样本进行欠采样;最后,采用多分类支持向量机构建降维后的微震信号分类器。
具体包括如下步骤:
步骤1)对源于微震监测系统采集的微震数据进行数据预处理,按照时间窗大小,划分微震检测数据集;
11)微震监测系统采集获得的微震数据以.w格式保存;采用专用软件SEISGR通过二进制流方式,将其格式转换为.asc格式的可读数据;进而,基于MATLAB软件平台,再将其转换为.csv格式的微震数据;
12)将转化格式后的微震数据,按照时间窗T,分割为[tmax/T]组采样数据,其中,tmax为采样微震数据的最大采样时间,T为时间窗大小。
步骤2)根据步骤1时间窗大小划分微震监测数据集,时间窗内各个微震检波测量探头所采集的微震信号,将每个探头采集到的信号划分为一个信道,对每个信道采集到的信号求取均值和方差,作为该信道的特征,并对同一样本的所有信道特征,按照顺序进行合并构成样本特征,构建特征提取后的非平衡训练样本集;
21)记为第k组采样数据中第n个微震检波测量探头在第t个采样时刻获得的微震信号,其中,n=1,2,…,N,t=1,2,…,T,k=1,2,…,K,N为微震检波测量探头个数,K为采样数据集规模;根据每组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的空间距离d(on,z)=‖on-z‖2,计算该组微震监测信号的能量值ek,记为:
ek=λ(rk)q
其中,q和λ为预先设定的常数,on和z分别为微震检波测量探头的空间位置和微震震源的空间位置,则:
其中,rk表示第k组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的最大空间距离;
22)以104J为能量分界点,满足ek≤104J的微震信号,标记为弱微震信号,即yk=1;满足ek>104J的微震信号,标记为强微震信号,即yk=2;
23)针对第k组采样数据,计算每个微震检波测量探头在时间窗内所采集微震信号的均值和方差/>分别为:
24)针对第k组采样数据,根据所求均值和方差构建新的采样数据特征:
其中,m=2N,为第k组采样数据的特征数;特征提取后的大类样本集S0={(xi,yi)|xi=si,yi=1},小类样本S2={(xi,yi)|xi=si,yi=2}。
步骤3)根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集;
构建平衡训练样本集的方法:确定各类样本的样本数目,根据样本数目对大类样本随机进行舍弃,直至大类中包含的样本数目与小类相当,形成新的平衡样本集S1={(xi,yi)|xi=si,yi=1},S2={(xi,yi)|xi=si,yi=2},i=1,2…,M,为平衡样本集的样本个数。
步骤4)根据步骤3获得的平衡训练样本集,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的训练样本集;
41)根据平衡样本集,构建类最优高斯核多分类支持向量机,其目标函数为:
ξic≥0,i=1,2,…,M
其中,ω为权重向量,b为偏置量,ф(xi)为高斯核函数映射,映射方式为:
di为描述不同样本与超平面之间距离的松弛变量。记为距离矩阵中的元素,c1为超平面类别,c2为样本类别,依次计算所有类别的超平面,根据当前超平面和样本的类别在距离矩阵中选取对应的di值。样本类别和超平面类别的距离矩阵为:
其中,为每两类样本之间的样本中心距离,/>为每一类样本的样本中心,mc为第c类样本的总数。
步骤42)利用拉格朗日乘子法对类最优高斯核多分类支持向量机的目标函数进行求解,可得权重向量为:
步骤43)根据权重向量对样本特征进行评分,评分标准为:
其中,f=1,2…,m,(-p)表示第p个特征被移除。
步骤44)按照特征评分标准,对所有的特征进行评分,然后将所有的特征平分为两部分,对每一部分的特征评分进行加和,移除评分较低的部分,之后重复上述步骤,直到剩余特征数为重要特征数h的二倍为止;对剩余的特征按照特征评分标准进行评分,并按照评分的大小进行排序,移除评分最小的特征,之后重复上述步骤,直到剩余特征数为重要特征数h为止。
步骤45)对于移除的特征,将其划分为包含特征数为l的若干份重筛选特征,将每一份重筛选特征拼接到重要特征后,构成特征数为h+l的样本集,利用多分类支持向量机进行分类,保留分类效果最好的重筛选特征,最终构成降维后的训练样本集。
步骤5)利用多分类支持向量机,构建降维后的微震信号分类学习器;构建降维后的微震信号分类学习器的方法:将降维后的训练样本(xi,yi)作为多分类支持向量机的输入,实现对分类学习器的训练。
步骤6)基于MATLAB软件平台,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性;验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法。
首先,基于MATLAB软件平台,构建基于类最优高斯核多分类支持向量机的微震信号识别方法;
其次,确定所提方法中的关键参数取值,包括多分类支持向量机的训练准确率和模型复杂度间的平衡常数C,高斯核函数的核参数σ,以及每个样本所选取的重要特征数h和重筛选特征数l;
最后,实验验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
实施例1:
某煤矿巷道的微震监测系统由20个微震检波测量探头构成,微震数据处理的时间窗设置为4小时,每个微震检波测量探头在该时间窗内包含10240个微震信号采样值,由此,构成一组微震信号。根据采样时间范围,共获得235组微震信号。
采用步骤2所述方法,计算235组微震信号的能量值,确定其强弱程度。其中,20组微震信号的能量计算值如表1所示。235组微震信号中,标记为弱微震信号的共计200个,标记为强微震信号的共计35个。
表1微震信号能量分布
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
能量/J | 2.42×107 | 7.98×106 | 5.55×106 | 5.53×106 | 2.91×106 | 2.66×106 | 1.69×106 |
编号 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
能量/J | 1.34×106 | 1.08×106 | 1.05×106 | 9.99×105 | 8.11×105 | 7.56×105 | 5.65×105 |
编号 | 15 | 16 | 17 | 18 | 19 | 20 | |
能量/J | 4.55×105 | 3.08×105 | 2.47×105 | 1.34×105 | 1.05×105 | 8.34×104 |
采用步骤2所述方法对原始数据进行特征提取,计算每组微震数据中各个信道在该时间窗内的均值和方差,根据所求均值和方差构建新的采样数据sk,形成新的非平衡训练样本集,大类为弱微震信号S0,小类为强微震信号S2。这里,sk的维度为1×40,|S0|=200,|S2|=35。
采用步骤3所述方法,根据样本数目对大类样本随机进行舍弃,直至大类中包含的样本数目与小类相当,形成新的平衡样本集,弱微震信号样本集S1和强微震信号样本集S2。这里,有|S1|=|S2|=35。
采用步骤4所述方法,计算各超平面与样本之间的距离di,构建类最优高斯核多分类支持向量机,其参数设置为C=0.01,σ=1;利用拉格朗日乘子法求解权重矩阵,并对特征进行评分,选出h个重要特征以及l个重筛选特征,构建降维后的采样数据sk。
采用步骤5所述方法,实现微震信号分类器学习,分类器参数为C=0.01。
从两类微震数据中,分别选取2/3作为训练样本,1/3作为测试样本。当h和l取不同值时,获得其分类测试结果,如表2所示,相应的测试分类识别准确率曲线图1所示。可见,当h=5且l=5时,选用的特征数最少,且分类性能最优。
表2不同h和l取值下的数据集分类性能
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
1 | 93.65 | 86.96 | 81.12 | 86.96 | 91.30 | 91.30 | 91.30 | 78.26 | 78.26 | 91.30 |
2 | 91.25 | 86.96 | 82.12 | 86.96 | 91.30 | 93.65 | 94.35 | 82.61 | 91.30 | 91.30 |
3 | 87.65 | 86.96 | 85.59 | 91.30 | 93.77 | 93.65 | 91.30 | 86.96 | 91.30 | 91.30 |
4 | 91.23 | 91.30 | 90.96 | 91.30 | 93.77 | 93.65 | 82.61 | 91.30 | 91.30 | 95.65 |
5 | 92.56 | 92.56 | 92.56 | 92.45 | 95.65 | 95.65 | 86.96 | 91.30 | 95.65 | 95.65 |
6 | 91.30 | 91.30 | 86.96 | 86.96 | 91.30 | 86.96 | 91.30 | 91.30 | 91.30 | 91.30 |
7 | 86.96 | 86.96 | 91.30 | 91.30 | 86.96 | 86.96 | 91.30 | 91.30 | 91.30 | 91.30 |
8 | 86.96 | 86.96 | 86.96 | 82.61 | 86.96 | 91.30 | 91.30 | 86.96 | 86.96 | 82.61 |
9 | 86.96 | 91.30 | 86.96 | 86.96 | 86.96 | 86.96 | 86.96 | 86.96 | 82.61 | 78.26 |
10 | 86.96 | 86.96 | 82.61 | 86.96 | 91.30 | 91.30 | 86.96 | 82.61 | 82.61 | 82.61 |
本发明解决了微震信号在分类识别中存在的非平衡和微震信号维度高、信噪比低、计算代价高等问题;通过特征提取和特征选择双重降维的方法,大大降低了微震信号数据的维度,提取其中的有效信息,防止了数据的冗余,大大降低了计算代价,提高了微震信号学习器的分类准确率和时效性,为冲击地压灾害及时有效的预警提供了有力的支持。
以上所述仅是本发明的优选实施方式,应当指出对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:微震信号识别方法,能够快速准确地预警冲击地压灾害;首先,对微震数据进行数据格式转换,并且对每个数据样本按照信道进行划分;其次,对每个信道的数据利用求取均值和方差的方式进行特征提取,并将同一样本所有信道提取的均值和方差特征组合成为一个数组,构成初步的特征向量;利用类最优高斯核多分类支持向量机对合成后的数据进行特征选择,生成降维后的非平衡训练样本集;再次,根据训练样本的非平衡率,确定欠采样倍率,对大类样本进行欠采样;最后,采用多分类支持向量机构建降维后的微震信号分类器;
采用微震信号识别方法,包括以下步骤:
步骤1)通过SOS微震监测系统采集微震数据并进行数据预处理,按照时间窗大小,划分微震监测数据集;
步骤2)根据步骤1时间窗大小划分微震监测数据集,得到时间窗内各个微震检波测量探头所采集的微震信号,每个探头采集到的信号划分为一个信道,对每个信道采集到的信号求取均值和方差,作为该信道的特征,并对同一样本的所有信道特征按照顺序进行合并构成样本特征,构建特征提取后的非平衡训练样本集;
步骤3)根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集;
步骤4)根据步骤3获得的平衡训练样本集,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的训练样本集;
步骤5)利用多分类支持向量机,构建降维后的微震信号分类学习器;
步骤6)基于MATLAB软件平台,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性;
所述步骤2中,信道特征合成为样本特征的方法:
步骤21)记为第k组采样数据中第n个微震检波测量探头在第t个采样时刻获得的微震信号,其中,n=1,2,…,N,t=1,2,…,T,k=1,2,…,K,N为微震检波测量探头个数,K为采样数据集规模;根据每组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的空间距离d(on,z)=||on-z||2,计算该组微震监测信号的能量值ek,记为:
ek=λ(rk)q
其中,q和λ为预先设定的常数,on和z分别为微震检波测量探头的空间位置和微震震源的空间位置,则:
其中,rk表示第k组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的最大空间距离;
步骤22)以104J为能量分界点,满足ek≤104J的微震信号,标记为弱微震信号,即yk=1;满足ek>104J的微震信号,标记为强微震信号,即yk=2;
步骤23)针对第k组采样数据,计算每个微震检波测量探头在时间窗内所采集微震信号的均值和方差/>分别为:
步骤24)针对第k组采样数据,根据所求均值和方差构建新的采样数据特征:
其中,m=2N,为第k组采样数据的特征数;特征提取后的大类样本集S1={(xi,yi)|xi=si,yi=1},i=1,2…,M1,为样本集中第i个样本,M1为大类样本数据集规模;小类样本S2={(xi,yi)|xi=si,yi=2};i=1,2…,M2,为样本集中第i个样本,M2为小类样本数据集规模;xi为第i组样本的特征,yi为第i组样本的标签;S1和S2分别为弱微震信号和强微震信号数据集;s为微震信号数据,i为微震信号样本的索引。
2.根据权利要求1所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤1中,对SOS微震监测系统采集获得的微震数据以.w格式保存;采用专用软件SEISGR通过二进制流方式,将其格式转换为.asc格式的可读数据;进而,基于MATLAB软件平台,再将其转换为.csv格式的微震数据。
3.根据权利要求1所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤1中,按照时间窗大小划分微震检测数据集的方法:将转化格式后的微震数据,按照时间窗T,分割为[tmax/T]组采样数据,其中,tmax为采样微震数据的最大采样时间,T为时间窗大小。
4.根据权利要求1所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤3中,根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集的方法:确定各类样本的样本数目,根据样本数目对大类样本随机进行舍弃,直至大类中包含的样本数目与小类相当,形成新的平衡样本集S1={(xi,yi)|xi=si,yi=1},S2={(xi,yi)|xi=si,yi=2},i=1,2…,M,为平衡样本集的样本个数;
S为数据集,S1为弱微震信号数据集,S2为强微震信号数据集;s为微震信号数据,M为采样数据集规模;xi为第i组样本的特征,yi为第i组样本的标签。
5.根据权利要求1所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤4中,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的降维训练样本集的方法:
步骤41)根据平衡样本集,构建类最优高斯核多分类支持向量机,其目标函数为:
满足约束
ξic≥0,i=1,2,…,M
其中,C为惩罚系数,M为采样数据集规模,ωc为支持向量的超平面法向量,ξic为松弛变量,使支持向量机软间隔最大化;di为第i组样本的微震检波测量探头与微震震源之间的空间距离;bic为第i组样本的偏置量,ωic为第i组样本的权重向量,xi为第i组样本的特征;ω为权重向量,b为偏置量,ф(xi)为高斯核函数映射,映射方式为:
di为描述不同样本与超平面之间距离的松弛变量;记为距离矩阵中的元素,c1为超平面类别,c2为样本类别,xi为第i组样本的特征,xj为第j组样本的特征;依次计算所有类别的超平面,根据当前超平面和样本的类别在距离矩阵中选取对应的di值;样本类别和超平面类别的距离矩阵为:
其中,为每两类样本之间的样本中心距离,/>为每一类样本的样本中心,mc为第c类样本的总数,xic为c类样本的第i组样本;
步骤42)利用拉格朗日乘子法对类最优高斯核多分类支持向量机的目标函数进行求解,可得权重向量为:
其中,αi,αj为构建拉格朗日乘子法引进的拉格朗日乘子;
步骤43)根据权重向量对样本特征进行评分,评分标准为:
其中,f=1,2…,m,(-p)表示第p个特征被移除;p为第p个特征;
步骤44)按照特征评分标准,对所有的特征进行评分,然后将所有的特征平分为两部分,对每一部分的特征评分进行加和,移除评分较低的部分,之后重复上述步骤,直到剩余特征数为重要特征数h的二倍为止;对剩余的特征按照特征评分标准进行评分,并按照评分的大小进行排序,移除评分最小的特征,之后重复上述步骤,直到剩余特征数为重要特征数h为止;
步骤45)对于移除的特征,将其划分为包含特征数为l的若干份重筛选特征,将每一份重筛选特征拼接到重要特征后,构成特征数为h+l的样本集,利用多分类支持向量机进行分类,保留分类效果最好的重筛选特征,最终构成降维后的训练样本集。
6.根据权利要求1所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤5)中,利用多分类支持向量机,构建降维后的微震信号分类学习器的方法:将降维后的训练样本(xi,yi)作为多分类支持向量机的输入,实现对分类学习器的训练;
xi为第i组样本的特征,yi为第i组样本的标签。
7.根据权利要求1所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤6)中,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性的方法:
首先,基于MATLAB软件平台,构建基于类最优高斯核多分类支持向量机的微震信号识别方法;
其次,确定所提方法中的关键参数取值,包括多分类支持向量机的训练准确率和模型复杂度间的平衡常数C,高斯核函数的核参数σ,以及每个样本所选取的重要特征数h和重筛选特征数l;
最后,实验验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010101031.1A CN111275003B (zh) | 2020-02-19 | 2020-02-19 | 基于类最优高斯核多分类支持向量机的微震信号识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010101031.1A CN111275003B (zh) | 2020-02-19 | 2020-02-19 | 基于类最优高斯核多分类支持向量机的微震信号识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111275003A CN111275003A (zh) | 2020-06-12 |
CN111275003B true CN111275003B (zh) | 2023-08-01 |
Family
ID=71002105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010101031.1A Active CN111275003B (zh) | 2020-02-19 | 2020-02-19 | 基于类最优高斯核多分类支持向量机的微震信号识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111275003B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113593187A (zh) * | 2021-07-26 | 2021-11-02 | 吉林大学 | 一种用于区域安防的地震动异常感知方法 |
CN114531324B (zh) * | 2021-09-16 | 2023-07-25 | 北京理工大学 | 一种基于信道测量的分类方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107563435A (zh) * | 2017-08-30 | 2018-01-09 | 哈尔滨工业大学深圳研究生院 | 基于svm的高维不平衡数据分类方法 |
CN110688983A (zh) * | 2019-08-22 | 2020-01-14 | 中国矿业大学 | 基于多模态优化和集成学习的微震信号识别方法 |
-
2020
- 2020-02-19 CN CN202010101031.1A patent/CN111275003B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107563435A (zh) * | 2017-08-30 | 2018-01-09 | 哈尔滨工业大学深圳研究生院 | 基于svm的高维不平衡数据分类方法 |
WO2019041629A1 (zh) * | 2017-08-30 | 2019-03-07 | 哈尔滨工业大学深圳研究生院 | 基于svm的高维不平衡数据分类方法 |
CN110688983A (zh) * | 2019-08-22 | 2020-01-14 | 中国矿业大学 | 基于多模态优化和集成学习的微震信号识别方法 |
Non-Patent Citations (4)
Title |
---|
Evolution strategy based adaptive Lq penalty support vector machines with Gauss kernel for credit risk analysis;Qi Wu;Expert Systems with Applications;第38卷;184-192 * |
基于半监督过采样非平衡学习的矿山微震信号识别;程健 等;煤炭科学技术;第46卷(第02期);202,213-218 * |
基于类重叠度欠采样的不平衡模糊多类支持向量机;吴园园 等;中国科学院大学学报;第35卷(第04期);536-543 * |
核极化的特征选择算法在LSSVM 中的应用;王建国 等;机械设计与制造(第07期);19-22 * |
Also Published As
Publication number | Publication date |
---|---|
CN111275003A (zh) | 2020-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105956526B (zh) | 基于多尺度排列熵的低信噪比微震事件辨识方法 | |
CN108830328B (zh) | 融合空间知识的微震信号smote识别方法及监测系统 | |
CN112858473B (zh) | 一种基于特征融合的道岔尖轨伤损状态监测方法 | |
CN112036301B (zh) | 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法 | |
CN111123355B (zh) | 一种基于微震监测数据的岩爆预测方法及系统 | |
CN111275003B (zh) | 基于类最优高斯核多分类支持向量机的微震信号识别方法 | |
CN110795843B (zh) | 一种识别滚动轴承故障的方法及装置 | |
Ince et al. | A machine learning approach for locating acoustic emission | |
CN103412557A (zh) | 一种适于非线性过程在线监控的工业故障检测与诊断方法 | |
CN107328868A (zh) | 一种快速识别陶瓷涂层失效类型的声发射信号分析方法 | |
CN107992802A (zh) | 一种基于nmf的微震弱信号识别方法 | |
CN103487513A (zh) | 一种空间碎片撞击毁伤声发射信号类型识别方法 | |
CN110533007A (zh) | 一种桥梁车载应变影响线特征智能识别与提取方法 | |
CN111667000B (zh) | 自适应领域深度神经网络的地震预警方法 | |
CN110688983A (zh) | 基于多模态优化和集成学习的微震信号识别方法 | |
CN112364296A (zh) | 一种基于深度学习的p波到时自动拾取方法 | |
CN115327613A (zh) | 一种“多层多级”模式的矿山微震波形自动分类识别方法 | |
CN115392284A (zh) | 一种基于机器学习的场地微振动振源识别方法 | |
CN116735170A (zh) | 一种基于自注意力多尺度特征提取的智能故障诊断方法 | |
KR20200061307A (ko) | 딥러닝을 이용한 지진 분류 방법 및 장치 | |
CN113340547A (zh) | 一种基于改进集总平均经验分解的绞车振动诊断方法 | |
CN109840386B (zh) | 基于因子分析的损伤识别方法 | |
CN111191502A (zh) | 基于钻柱振动信号的粘滑和跳钻异常工况识别方法 | |
Wang | PCA-LSTM: An Impulsive Ground-Shaking Identification Method Based on Combined Deep Learning. | |
CN112788057A (zh) | 一种基于FSWT时频分布的LDoS攻击检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |