CN111275003A - 基于类最优高斯核多分类支持向量机的微震信号识别方法 - Google Patents

基于类最优高斯核多分类支持向量机的微震信号识别方法 Download PDF

Info

Publication number
CN111275003A
CN111275003A CN202010101031.1A CN202010101031A CN111275003A CN 111275003 A CN111275003 A CN 111275003A CN 202010101031 A CN202010101031 A CN 202010101031A CN 111275003 A CN111275003 A CN 111275003A
Authority
CN
China
Prior art keywords
microseismic
support vector
vector machine
class
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010101031.1A
Other languages
English (en)
Other versions
CN111275003B (zh
Inventor
程健
张子睿
郭一楠
唐凤珍
曹安业
崔宁
焦博韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coal Science Research Institute
China University of Mining and Technology CUMT
Shenyang Institute of Automation of CAS
Original Assignee
Coal Science Research Institute
China University of Mining and Technology CUMT
Shenyang Institute of Automation of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coal Science Research Institute, China University of Mining and Technology CUMT, Shenyang Institute of Automation of CAS filed Critical Coal Science Research Institute
Priority to CN202010101031.1A priority Critical patent/CN111275003B/zh
Publication of CN111275003A publication Critical patent/CN111275003A/zh
Application granted granted Critical
Publication of CN111275003B publication Critical patent/CN111275003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/288Event detection in seismic signals, e.g. microseismics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/30Assessment of water resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Geology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geophysics (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于类最优高斯核多分类支持向量机的微震信号识别方法,属于机器学习与数据挖掘领域。首先,对微震数据按照信道划分,并进行数据格式转换;其次,对每个信道数据根据均值和方差进行特征提取,并将同一样本的所有信道合并,构成新特征,利用类最优高斯核多分类支持向量机,对合成数据进行特征选择,生成降维后的非平衡训练样本集;再次,根据训练样本的非平衡率,确定欠采样倍率,对大类样本进行欠采样;最后,采用多分类支持向量机构建降维后的微震信号分类器。本发明可以有效减少冗余特征对分类的影响;通过对信道特征和合并特征进行双重降维,有效降低微震信号维度,提高微震信号分类器的正确率和时效性,增加冲击地压灾害预警的准确率。

Description

基于类最优高斯核多分类支持向量机的微震信号识别方法
技术领域
本发明涉及一种微震信号识别方法,特别是一种基于类最优高斯核多分类支持向量机的微震信号识别方法,属于机器学习与数据挖掘领域。
背景技术
冲击地压是一种典型的煤矿动力灾害,严重威胁煤矿的高效生产和人员安全,因此,对冲击地压灾害的预警至关重要。冲击地压指在高应力作用下,聚集的能量突然释放,对煤岩体造成冲击,导致人员伤亡,建筑物破坏的现象。微震是采矿活动诱发的微地震,是煤岩介质在矿区应力作用下,聚集的弹性应变能突然释放,造成采掘空间周围岩体破裂的现象。因此,通过对微震信号分类,可以有效识别煤岩体状态,逐渐成为冲击地压预警的一种有效手段。
目前,微震信号数据识别的方法主要有时频分析和机器学习方法两类。其中,时频分析能有效分析微震波形频谱特征。常用的时频分析方法包括傅里叶变换、小波变换、小波包变换和频率切片小波变换,等。文献(曹安业,窦林名,秦玉红,等.高应力区微震监测信号特征分析[J].采矿与安全工程学报,2007,24(2):146-149.)利用傅里叶变换,得到矿山微震信号的幅频特征,为煤矿微震信号的初步辨识提供依据。文献(唐守锋,童敏明,潘玉祥,等.煤岩破裂微震信号的小波特征能谱系数分析法[J].仪器仪表学报,2011,32(7):1521-1527.)分析了微震信号与噪声信号的能量分布特征,提出采用小波能谱系数的方法,提取微震信号的特征信息。文献(赵国彦,邓青林,马举.基于时频分析的矿山微震信号分析与识别[J].岩土工程学报,2015,37(2):306-312.)采用频率切片小波变换,识别煤矿微震信号。
时频域分析方法虽然可以有效分析煤矿微震信号频谱的特性,但是,由于每个传感器产生的数据量规模巨大,所以现场实时应用存在一定难度。因此,结合机器学习和计算机技术,实现大规模微震数据处理成为微震数据分析的一种新兴有效方法。文献(朱权洁,姜福兴,尹永明,等.基于小波分形特征与模式识别的矿山微震波形识别研究[J].岩土工程学报,2012,34(11):2036-2042.)将小波包与分形相结合,提取微震信号特征,并采用支持向量机实现微震信号分类。文献(Vallejos J A,Mckinnon S D.Logistic regression andneural network classification of seismic records[J].Inernational Journal ofRock Mechanics&Mining Sciences,2013,62(9):86-95.)应用逻辑回归和人工神经网络,对微震信号和爆炸信号实现分类。文献(Dong L,Wesseloo J,Potvin Y,etal.Discrimination of Mine Seismic Events and Blasts Using the FisherClassifier,
Figure BDA0002386875150000011
Bayesian Classifier and Logistic Regression[J].RockMechanics and Rock Engineering,2016,49(1):183-211.)采用Fisher分类器、朴素贝叶斯分类器和逻辑回归,分析矿山微震和爆炸事件发生的可能性。
目前,微震信号的识别主要存在以下不足煤矿微震信号受背景噪音、机械振动等环境因素影响,信噪比低,不同微震信号采集点获取的微震数据存在一定不平衡性,已有的微震监测系统存在自动识别效果差、分类准确率低且不稳定等问题。鉴于此,设计一种准确有效的煤矿冲击地压微震信号数据识别方法,对煤矿冲击地压灾害的监测及预警具有重要意义。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于类最优高斯核多分类支持向量机的微震信号识别方法,解决微震信号在分类识别中存在的数据量过大,存在数据特征冗余,信噪比低和样本之间非平衡的问题;实现快速准确地识别微震信号数据,节约计算资源,提高反应速度。
技术方案:为实现上述目的,本发明采用的技术方案为:微震信号识别方法,通过特征选择选择的方式实现对微震信号的降维,从而提高微震信号的分类速度及准确率,能够快速准确地预警冲击地压灾害;首先,对微震数据进行数据格式转换,并且对每个数据样本按照信道进行划分;其次,对每个信道的数据利用求取均值和方差的方式进行特征提取,并将同一样本的所有信道进行合并,构成新的特征,利用类最优高斯核多分类支持向量机对合成后的数据进行特征选择,生成降维后的非平衡训练样本集;再次,根据训练样本的非平衡率,确定欠采样倍率,对大类样本进行欠采样;最后,采用多分类支持向量机构建降维后的微震信号分类器。
微震信号识别方法,包括以下步骤:
步骤1)通过微震监测系统采集微震数据并进行数据预处理,按照时间窗大小,划分微震监测数据集;
步骤2)根据步骤1时间窗大小划分微震监测数据集,得到时间窗内各个微震检波测量探头所采集的微震信号,每个探头采集到的信号划分为一个信道,对每个信道采集到的信号求取均值和方差,作为该信道的特征,并对同一样本的所有信道特征,按照顺序进行合并构成样本特征,构建特征提取后的非平衡训练样本集;
步骤3)根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集;
步骤4)根据步骤3获得的平衡训练样本集,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的训练样本集;
步骤5)利用多分类支持向量机,构建降维后的微震信号分类学习器;
步骤6)基于MATLAB软件平台,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
优选的:所述步骤1中,对SOS微震监测系统采集获得的微震数据以.w格式保存;采用专用软件SEISGR通过二进制流方式,将其格式转换为.asc格式的可读数据;进而,基于MATLAB软件平台,再将其转换为.csv格式的微震数据。
优选的:所述步骤1中,按照时间窗大小划分微震检测数据集的方法:将转化格式后的微震数据,按照时间窗T,分割为[tmax/T]组采样数据,其中,tmax为采样微震数据的最大采样时间,T为时间窗大小。
优选的:所述步骤2中,信道特征合成为样本特征的方法:
步骤21)记
Figure BDA0002386875150000031
为第k组采样数据中第n个微震检波测量探头在第t个采样时刻获得的微震信号,其中,n=1,2,…,N,t=1,2,…,T,k=1,2,…,K,N为微震检波测量探头个数,K为采样数据集规模;根据每组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的空间距离d(on,z)=‖on-z‖2,计算该组微震监测信号的能量值ek,记为:
ek=λ(rk)q
其中,q和λ为预先设定的常数,on和z分别为微震检波测量探头的空间位置和微震震源的空间位置,则:
Figure BDA0002386875150000032
其中,rk表示第k组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的最大空间距离;
步骤22)以104J为能量分界点,满足ek≤104J的微震信号,标记为弱微震信号,即yk=1;满足ek>104J的微震信号,标记为强微震信号,即yk=2;
步骤23)针对第k组采样数据,计算每个微震检波测量探头在时间窗内所采集微震信号的均值
Figure BDA0002386875150000033
和方差
Figure BDA0002386875150000034
分别为:
Figure BDA0002386875150000035
Figure BDA0002386875150000036
步骤24)针对第k组采样数据,根据所求均值和方差构建新的采样数据特征:
Figure BDA0002386875150000037
其中,m=2N,为第k组采样数据的特征数;特征提取后的大类样本集S0={(xi,yi)|xi=si,yi=1},小类样本S2={(xi,yi)|xi=si,yi=2}。
优选的:所述步骤3中,根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集的方法:确定各类样本的样本数目,根据样本数目对大类样本随机进行舍弃,直至大类中包含的样本数目与小类相当,形成新的平衡样本集S1={(xi,yi)|xi=si,yi=1},S2={(xi,yi)|xi=si,yi=2},i=1,2…,M,为平衡样本集的样本个数。
优选的:所述步骤4中,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的降维训练样本集的方法:
步骤41)根据平衡样本集,构建类最优高斯核多分类支持向量机,其目标函数为:
Figure BDA0002386875150000041
Figure BDA0002386875150000042
ξic≥0,i=1,2,…,M
其中,ω为权重向量,b为偏置量,ф(xi)为高斯核函数映射,映射方式为:
Figure BDA0002386875150000043
di为描述不同样本与超平面之间距离的松弛变量;记
Figure BDA0002386875150000044
为距离矩阵中的元素,c1为超平面类别,c2为样本类别,依次计算所有类别的超平面,根据当前超平面和样本的类别在距离矩阵中选取对应的di值;样本类别和超平面类别的距离矩阵为:
Figure BDA0002386875150000045
其中,
Figure BDA0002386875150000046
为每两类样本之间的样本中心距离,
Figure BDA0002386875150000047
为每一类样本的样本中心,mc为第c类样本的总数;
步骤42)利用拉格朗日乘子法对类最优高斯核多分类支持向量机的目标函数进行求解,可得权重向量为:
Figure BDA0002386875150000048
步骤43)根据权重向量对样本特征进行评分,评分标准为:
Figure BDA0002386875150000049
其中,f=1,2…,m,(-p)表示第p个特征被移除;
步骤44)按照特征评分标准,对所有的特征进行评分,然后将所有的特征平分为两部分,对每一部分的特征评分进行加和,移除评分较低的部分,之后重复上述步骤,直到剩余特征数为重要特征数h的二倍为止;对剩余的特征按照特征评分标准进行评分,并按照评分的大小进行排序,移除评分最小的特征,之后重复上述步骤,直到剩余特征数为重要特征数h为止;
步骤45)对于移除的特征,将其划分为包含特征数为l的若干份重筛选特征,将每一份重筛选特征拼接到重要特征后,构成特征数为h+l的样本集,利用多分类支持向量机进行分类,保留分类效果最好的重筛选特征,最终构成降维后的训练样本集。
优选的:所述步骤5)中,利用多分类支持向量机,构建降维后的微震信号分类学习器的方法:将降维后的训练样本(xi,yi)作为多分类支持向量机的输入,实现对分类学习器的训练。
优选的:所述步骤6)中,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性的方法:
首先,基于MATLAB软件平台,构建基于类最优高斯核多分类支持向量机的微震信号识别方法;
其次,确定所提方法中的关键参数取值,包括多分类支持向量机的训练准确率和模型复杂度间的平衡常数C,高斯核函数的核参数σ,以及每个样本所选取的重要特征数h和重筛选特征数l;
最后,实验验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
本发明相比现有技术,具有以下有益效果及优点:
本发明适用于对煤矿微震信号的分类识别,解决了微震信号在分类识别中存在的数据量过大,存在数据特征冗余,信噪比低和样本之间非平衡的问题;提出的基于类最优高斯核多分类支持向量机的微震信号识别方法,一方面,利用特征提取的方式对高维度低信噪比的微震信号进行初步降维,大幅降低计算复杂度,提高识别速度;另一方面,利用类最优高斯核多分类支持向量机,对数据进一步降维,去除冗余特征,提高分类准确率,为精确识别冲击地压灾害及时有效预警提供更有力的支持。
附图说明
图1是本发明实施例的分类识别准确率图
具体实施方式
基于类最优高斯核多分类支持向量机的微震信号识别方法,用于实现微震信号的分类,完成对冲击地压灾害更加准确及时的预警。
通过特征选择选择的方式实现对微震信号的降维,从而提高微震信号的分类速度及准确率,能够快速准确地预警冲击地压灾害。首先,对微震数据进行数据格式转换,并且对每个数据样本按照信道进行划分;其次,对每个信道的数据利用求取均值和方差的方式进行特征提取,并将同一样本的所有信道进行合并,构成新的特征,利用类最优高斯核多分类支持向量机对合成后的数据进行特征选择,生成降维后的非平衡训练样本集;再次,根据训练样本的非平衡率,确定欠采样倍率,对大类样本进行欠采样;最后,采用多分类支持向量机构建降维后的微震信号分类器。
具体包括如下步骤:
步骤1)对源于微震监测系统采集的微震数据进行数据预处理,按照时间窗大小,划分微震检测数据集;
11)微震监测系统采集获得的微震数据以.w格式保存;采用专用软件SEISGR通过二进制流方式,将其格式转换为.asc格式的可读数据;进而,基于MATLAB软件平台,再将其转换为.csv格式的微震数据;
12)将转化格式后的微震数据,按照时间窗T,分割为[tmax/T]组采样数据,其中,tmax为采样微震数据的最大采样时间,T为时间窗大小。
步骤2)根据步骤1时间窗大小划分微震监测数据集,时间窗内各个微震检波测量探头所采集的微震信号,将每个探头采集到的信号划分为一个信道,对每个信道采集到的信号求取均值和方差,作为该信道的特征,并对同一样本的所有信道特征,按照顺序进行合并构成样本特征,构建特征提取后的非平衡训练样本集;
21)记
Figure BDA0002386875150000061
为第k组采样数据中第n个微震检波测量探头在第t个采样时刻获得的微震信号,其中,n=1,2,…,N,t=1,2,…,T,k=1,2,…,K,N为微震检波测量探头个数,K为采样数据集规模;根据每组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的空间距离d(on,z)=‖on-z‖2,计算该组微震监测信号的能量值ek,记为:
ek=λ(rk)q
其中,q和λ为预先设定的常数,on和z分别为微震检波测量探头的空间位置和微震震源的空间位置,则:
Figure BDA0002386875150000062
其中,rk表示第k组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的最大空间距离;
22)以104J为能量分界点,满足ek≤104J的微震信号,标记为弱微震信号,即yk=1;满足ek>104J的微震信号,标记为强微震信号,即yk=2;
23)针对第k组采样数据,计算每个微震检波测量探头在时间窗内所采集微震信号的均值
Figure BDA0002386875150000063
和方差
Figure BDA0002386875150000064
分别为:
Figure BDA0002386875150000065
Figure BDA0002386875150000066
24)针对第k组采样数据,根据所求均值和方差构建新的采样数据特征:
Figure BDA0002386875150000067
其中,m=2N,为第k组采样数据的特征数;特征提取后的大类样本集S0={(xi,yi)|xi=si,yi=1},小类样本S2={(xi,yi)|xi=si,yi=2}。
步骤3)根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集;
构建平衡训练样本集的方法:确定各类样本的样本数目,根据样本数目对大类样本随机进行舍弃,直至大类中包含的样本数目与小类相当,形成新的平衡样本集S1={(xi,yi)|xi=si,yi=1},S2={(xi,yi)|xi=si,yi=2},i=1,2…,M,为平衡样本集的样本个数。
步骤4)根据步骤3获得的平衡训练样本集,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的训练样本集;
41)根据平衡样本集,构建类最优高斯核多分类支持向量机,其目标函数为:
Figure BDA0002386875150000071
Figure BDA0002386875150000072
ξic≥0,i=1,2,…,M
其中,ω为权重向量,b为偏置量,ф(xi)为高斯核函数映射,映射方式为:
Figure BDA0002386875150000073
di为描述不同样本与超平面之间距离的松弛变量。记
Figure BDA0002386875150000074
为距离矩阵中的元素,c1为超平面类别,c2为样本类别,依次计算所有类别的超平面,根据当前超平面和样本的类别在距离矩阵中选取对应的di值。样本类别和超平面类别的距离矩阵为:
Figure BDA0002386875150000075
其中,
Figure BDA0002386875150000076
为每两类样本之间的样本中心距离,
Figure BDA0002386875150000077
为每一类样本的样本中心,mc为第c类样本的总数。
步骤42)利用拉格朗日乘子法对类最优高斯核多分类支持向量机的目标函数进行求解,可得权重向量为:
Figure BDA0002386875150000078
步骤43)根据权重向量对样本特征进行评分,评分标准为:
Figure BDA0002386875150000079
其中,f=1,2…,m,(-p)表示第p个特征被移除。
步骤44)按照特征评分标准,对所有的特征进行评分,然后将所有的特征平分为两部分,对每一部分的特征评分进行加和,移除评分较低的部分,之后重复上述步骤,直到剩余特征数为重要特征数h的二倍为止;对剩余的特征按照特征评分标准进行评分,并按照评分的大小进行排序,移除评分最小的特征,之后重复上述步骤,直到剩余特征数为重要特征数h为止。
步骤45)对于移除的特征,将其划分为包含特征数为l的若干份重筛选特征,将每一份重筛选特征拼接到重要特征后,构成特征数为h+l的样本集,利用多分类支持向量机进行分类,保留分类效果最好的重筛选特征,最终构成降维后的训练样本集。
步骤5)利用多分类支持向量机,构建降维后的微震信号分类学习器;构建降维后的微震信号分类学习器的方法:将降维后的训练样本(xi,yi)作为多分类支持向量机的输入,实现对分类学习器的训练。
步骤6)基于MATLAB软件平台,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性;验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法。
首先,基于MATLAB软件平台,构建基于类最优高斯核多分类支持向量机的微震信号识别方法;
其次,确定所提方法中的关键参数取值,包括多分类支持向量机的训练准确率和模型复杂度间的平衡常数C,高斯核函数的核参数σ,以及每个样本所选取的重要特征数h和重筛选特征数l;
最后,实验验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
实施例1:
某煤矿巷道的微震监测系统由20个微震检波测量探头构成,微震数据处理的时间窗设置为4小时,每个微震检波测量探头在该时间窗内包含10240个微震信号采样值,由此,构成一组微震信号。根据采样时间范围,共获得235组微震信号。
采用步骤2所述方法,计算235组微震信号的能量值,确定其强弱程度。其中,20组微震信号的能量计算值如表1所示。235组微震信号中,标记为弱微震信号的共计200个,标记为强微震信号的共计35个。
表1微震信号能量分布
编号 1 2 3 4 5 6 7
能量/J 2.42×10<sup>7</sup> 7.98×10<sup>6</sup> 5.55×10<sup>6</sup> 5.53×10<sup>6</sup> 2.91×10<sup>6</sup> 2.66×10<sup>6</sup> 1.69×10<sup>6</sup>
编号 8 9 10 11 12 13 14
能量/J 1.34×10<sup>6</sup> 1.08×10<sup>6</sup> 1.05×10<sup>6</sup> 9.99×10<sup>5</sup> 8.11×10<sup>5</sup> 7.56×10<sup>5</sup> 5.65×10<sup>5</sup>
编号 15 16 17 18 19 20
能量/J 4.55×10<sup>5</sup> 3.08×10<sup>5</sup> 2.47×10<sup>5</sup> 1.34×10<sup>5</sup> 1.05×10<sup>5</sup> 8.34×10<sup>4</sup>
采用步骤2所述方法对原始数据进行特征提取,计算每组微震数据中各个信道在该时间窗内的均值和方差,根据所求均值和方差构建新的采样数据sk,形成新的非平衡训练样本集,大类为弱微震信号S0,小类为强微震信号S2。这里,sk的维度为1×40,|S0|=200,|S2|=35。
采用步骤3所述方法,根据样本数目对大类样本随机进行舍弃,直至大类中包含的样本数目与小类相当,形成新的平衡样本集,弱微震信号样本集S1和强微震信号样本集S2。这里,有|S1|=|S2|=35。
采用步骤4所述方法,计算各超平面与样本之间的距离di,构建类最优高斯核多分类支持向量机,其参数设置为C=0.01,σ=1;利用拉格朗日乘子法求解权重矩阵,并对特征进行评分,选出h个重要特征以及l个重筛选特征,构建降维后的采样数据sk
采用步骤5所述方法,实现微震信号分类器学习,分类器参数为C=0.01。
从两类微震数据中,分别选取2/3作为训练样本,1/3作为测试样本。当h和l取不同值时,获得其分类测试结果,如表2所示,相应的测试分类识别准确率曲线图1所示。可见,当h=5且l=5时,选用的特征数最少,且分类性能最优。
表2不同h和l取值下的数据集分类性能
1 2 3 4 5 6 7 8 9 10
1 93.65 86.96 81.12 86.96 91.30 91.30 91.30 78.26 78.26 91.30
2 91.25 86.96 82.12 86.96 91.30 93.65 94.35 82.61 91.30 91.30
3 87.65 86.96 85.59 91.30 93.77 93.65 91.30 86.96 91.30 91.30
4 91.23 91.30 90.96 91.30 93.77 93.65 82.61 91.30 91.30 95.65
5 92.56 92.56 92.56 92.45 95.65 95.65 86.96 91.30 95.65 95.65
6 91.30 91.30 86.96 86.96 91.30 86.96 91.30 91.30 91.30 91.30
7 86.96 86.96 91.30 91.30 86.96 86.96 91.30 91.30 91.30 91.30
8 86.96 86.96 86.96 82.61 86.96 91.30 91.30 86.96 86.96 82.61
9 86.96 91.30 86.96 86.96 86.96 86.96 86.96 86.96 82.61 78.26
10 86.96 86.96 82.61 86.96 91.30 91.30 86.96 82.61 82.61 82.61
本发明解决了微震信号在分类识别中存在的非平衡和微震信号维度高、信噪比低、计算代价高等问题;通过特征提取和特征选择双重降维的方法,大大降低了微震信号数据的维度,提取其中的有效信息,防止了数据的冗余,大大降低了计算代价,提高了微震信号学习器的分类准确率和时效性,为冲击地压灾害及时有效的预警提供了有力的支持。
以上所述仅是本发明的优选实施方式,应当指出对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:微震信号识别方法,能够快速准确地预警冲击地压灾害;首先,对微震数据进行数据格式转换,并且对每个数据样本按照信道进行划分;其次,对每个信道的数据利用求取均值和方差的方式进行特征提取,并将同一样本的所有信道进行合并,构成新的特征,利用类最优高斯核多分类支持向量机对合成后的数据进行特征选择,生成降维后的非平衡训练样本集;再次,根据训练样本的非平衡率,确定欠采样倍率,对大类样本进行欠采样;最后,采用多分类支持向量机构建降维后的微震信号分类器。
2.根据权利要求1所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:采用微震信号识别方法,包括以下步骤:
步骤1)通过SOS微震监测系统采集微震数据并进行数据预处理,按照时间窗大小,划分微震监测数据集;
步骤2)根据步骤1时间窗大小划分微震监测数据集,得到时间窗内各个微震检波测量探头所采集的微震信号,每个探头采集到的信号划分为一个信道,对每个信道采集到的信号求取均值和方差,作为该信道的特征,并对同一样本的所有信道特征按照顺序进行合并构成样本特征,构建特征提取后的非平衡训练样本集;
步骤3)根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集;
步骤4)根据步骤3获得的平衡训练样本集,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的训练样本集;
步骤5)利用多分类支持向量机,构建降维后的微震信号分类学习器;
步骤6)基于MATLAB软件平台,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
3.根据权利要求2所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤1中,对SOS微震监测系统采集获得的微震数据以.w格式保存;采用专用软件SEISGR通过二进制流方式,将其格式转换为.asc格式的可读数据;进而,基于MATLAB软件平台,再将其转换为.csv格式的微震数据。
4.根据权利要求2所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤1中,按照时间窗大小划分微震检测数据集的方法:将转化格式后的微震数据,按照时间窗T,分割为[tmax/T]组采样数据,其中,tmax为采样微震数据的最大采样时间,T为时间窗大小。
5.根据权利要求2所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤2中,信道特征合成为样本特征的方法:
步骤21)记
Figure FDA0002386875140000011
为第k组采样数据中第n个微震检波测量探头在第t个采样时刻获得的微震信号,其中,n=1,2,…,N,t=1,2,…,T,k=1,2,…,K,N为微震检波测量探头个数,K为采样数据集规模;根据每组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的空间距离d(on,z)=‖on-z‖2,计算该组微震监测信号的能量值ek,记为:
ek=λ(rk)q
其中,q和λ为预先设定的常数,on和z分别为微震检波测量探头的空间位置和微震震源的空间位置,则:
Figure FDA0002386875140000021
其中,rk表示第k组采样数据中所有非零的有效微震信号所对应的微震检波测量探头与微震震源之间的最大空间距离;
步骤22)以104J为能量分界点,满足ek≤104J的微震信号,标记为弱微震信号,即yk=1;满足ek>104J的微震信号,标记为强微震信号,即yk=2;
步骤23)针对第k组采样数据,计算每个微震检波测量探头在时间窗内所采集微震信号的均值
Figure FDA0002386875140000022
和方差
Figure FDA0002386875140000023
分别为:
Figure FDA0002386875140000024
Figure FDA0002386875140000025
步骤24)针对第k组采样数据,根据所求均值和方差构建新的采样数据特征:
Figure FDA0002386875140000026
其中,m=2N,为第k组采样数据的特征数;特征提取后的大类样本集S0={(xi,yi)|xi=si,yi=1},小类样本S2={(xi,yi)|xi=si,yi=2}。
6.根据权利要求2所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤3中,根据训练样本集的非平衡率,对大类样本进行欠采样,构建平衡训练样本集的方法:确定各类样本的样本数目,根据样本数目对大类样本随机进行舍弃,直至大类中包含的样本数目与小类相当,形成新的平衡样本集S1={(xi,yi)|xi=si,yi=1},S2={(xi,yi)|xi=si,yi=2},i=1,2…,M,为平衡样本集的样本个数。
7.根据权利要求2所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤4中,基于类最优高斯核多分类支持向量机的权重向量对特征进行评分,然后利用快速迭代特征消除算法选择重要特征以及重筛选特征,构成降维后的降维训练样本集的方法:
步骤41)根据平衡样本集,构建类最优高斯核多分类支持向量机,其目标函数为:
Figure FDA0002386875140000031
Figure FDA0002386875140000032
ξic≥0,i=1,2,…,M
其中,ω为权重向量,b为偏置量,ф(xi)为高斯核函数映射,映射方式为:
Figure FDA0002386875140000039
di为描述不同样本与超平面之间距离的松弛变量;记
Figure FDA0002386875140000033
为距离矩阵中的元素,c1为超平面类别,c2为样本类别,依次计算所有类别的超平面,根据当前超平面和样本的类别在距离矩阵中选取对应的di值;样本类别和超平面类别的距离矩阵为:
Figure FDA0002386875140000034
其中,
Figure FDA0002386875140000035
为每两类样本之间的样本中心距离,
Figure FDA0002386875140000036
为每一类样本的样本中心,mc为第c类样本的总数;
步骤42)利用拉格朗日乘子法对类最优高斯核多分类支持向量机的目标函数进行求解,可得权重向量为:
Figure FDA0002386875140000037
步骤43)根据权重向量对样本特征进行评分,评分标准为:
Figure FDA0002386875140000038
其中,f=1,2…,m,(-p)表示第p个特征被移除;
步骤44)按照特征评分标准,对所有的特征进行评分,然后将所有的特征平分为两部分,对每一部分的特征评分进行加和,移除评分较低的部分,之后重复上述步骤,直到剩余特征数为重要特征数h的二倍为止;对剩余的特征按照特征评分标准进行评分,并按照评分的大小进行排序,移除评分最小的特征,之后重复上述步骤,直到剩余特征数为重要特征数h为止;
步骤45)对于移除的特征,将其划分为包含特征数为l的若干份重筛选特征,将每一份重筛选特征拼接到重要特征后,构成特征数为h+l的样本集,利用多分类支持向量机进行分类,保留分类效果最好的重筛选特征,最终构成降维后的训练样本集。
8.根据权利要求2所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤5)中,利用多分类支持向量机,构建降维后的微震信号分类学习器的方法:将降维后的训练样本(xi,yi)作为多分类支持向量机的输入,实现对分类学习器的训练。
9.根据权利要求2所述的基于类最优高斯核多分类支持向量机的微震信号识别方法,其特征是:所述步骤6)中,验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性的方法:
首先,基于MATLAB软件平台,构建基于类最优高斯核多分类支持向量机的微震信号识别方法;
其次,确定所提方法中的关键参数取值,包括多分类支持向量机的训练准确率和模型复杂度间的平衡常数C,高斯核函数的核参数σ,以及每个样本所选取的重要特征数h和重筛选特征数l;
最后,实验验证所提基于类最优高斯核多分类支持向量机的微震信号识别方法的有效性和合理性。
CN202010101031.1A 2020-02-19 2020-02-19 基于类最优高斯核多分类支持向量机的微震信号识别方法 Active CN111275003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010101031.1A CN111275003B (zh) 2020-02-19 2020-02-19 基于类最优高斯核多分类支持向量机的微震信号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010101031.1A CN111275003B (zh) 2020-02-19 2020-02-19 基于类最优高斯核多分类支持向量机的微震信号识别方法

Publications (2)

Publication Number Publication Date
CN111275003A true CN111275003A (zh) 2020-06-12
CN111275003B CN111275003B (zh) 2023-08-01

Family

ID=71002105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010101031.1A Active CN111275003B (zh) 2020-02-19 2020-02-19 基于类最优高斯核多分类支持向量机的微震信号识别方法

Country Status (1)

Country Link
CN (1) CN111275003B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593187A (zh) * 2021-07-26 2021-11-02 吉林大学 一种用于区域安防的地震动异常感知方法
CN114531324A (zh) * 2021-09-16 2022-05-24 北京理工大学 一种基于信道测量的分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563435A (zh) * 2017-08-30 2018-01-09 哈尔滨工业大学深圳研究生院 基于svm的高维不平衡数据分类方法
CN110688983A (zh) * 2019-08-22 2020-01-14 中国矿业大学 基于多模态优化和集成学习的微震信号识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563435A (zh) * 2017-08-30 2018-01-09 哈尔滨工业大学深圳研究生院 基于svm的高维不平衡数据分类方法
WO2019041629A1 (zh) * 2017-08-30 2019-03-07 哈尔滨工业大学深圳研究生院 基于svm的高维不平衡数据分类方法
CN110688983A (zh) * 2019-08-22 2020-01-14 中国矿业大学 基于多模态优化和集成学习的微震信号识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
QI WU: "Evolution strategy based adaptive Lq penalty support vector machines with Gauss kernel for credit risk analysis", EXPERT SYSTEMS WITH APPLICATIONS *
吴园园 等: "基于类重叠度欠采样的不平衡模糊多类支持向量机", 中国科学院大学学报 *
王建国 等: "核极化的特征选择算法在LSSVM 中的应用", 机械设计与制造 *
程健 等: "基于半监督过采样非平衡学习的矿山微震信号识别", 煤炭科学技术 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593187A (zh) * 2021-07-26 2021-11-02 吉林大学 一种用于区域安防的地震动异常感知方法
CN114531324A (zh) * 2021-09-16 2022-05-24 北京理工大学 一种基于信道测量的分类方法

Also Published As

Publication number Publication date
CN111275003B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN112036301B (zh) 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法
Aydadenta et al. A clustering approach for feature selection in microarray data classification using random forest
CN108830328B (zh) 融合空间知识的微震信号smote识别方法及监测系统
CN111881723B (zh) 雷电地闪回击波形的自动识别方法、系统及电子设备
CN105956526B (zh) 基于多尺度排列熵的低信噪比微震事件辨识方法
CN110795843B (zh) 一种识别滚动轴承故障的方法及装置
CN105760839A (zh) 基于多特征流形学习与支持向量机的轴承故障诊断方法
CN110044623A (zh) 经验模态分解剩余信号特征的滚动轴承故障智能识别方法
CN103245907A (zh) 一种模拟电路故障诊断方法
CN111275003A (zh) 基于类最优高斯核多分类支持向量机的微震信号识别方法
CN107992802A (zh) 一种基于nmf的微震弱信号识别方法
CN102592593B (zh) 一种考虑语音中多线性群组稀疏特性的情绪特征提取方法
CN107328868A (zh) 一种快速识别陶瓷涂层失效类型的声发射信号分析方法
CN114346761B (zh) 一种基于改进条件生成对抗网络的刀具磨损状况检测方法
CN103487513A (zh) 一种空间碎片撞击毁伤声发射信号类型识别方法
CN106419911A (zh) 一种基于脑电波分析的情绪检测方法
CN113792597A (zh) 一种基于自监督特征提取的机械设备异常声音检测方法
CN110020637A (zh) 一种基于多粒度级联森林的模拟电路间歇故障诊断方法
CN116735170A (zh) 一种基于自注意力多尺度特征提取的智能故障诊断方法
CN115392284A (zh) 一种基于机器学习的场地微振动振源识别方法
CN110688983A (zh) 基于多模态优化和集成学习的微震信号识别方法
CN110057918B (zh) 强噪声背景下的复合材料损伤定量识别方法及系统
CN115659143A (zh) 一种基于试验设计的故障实时诊断方法
CN111458145A (zh) 一种基于路图特征的缆车滚动轴承故障诊断方法
CN117451360A (zh) 一种基于自注意力机制的变工况小样本滚动轴承故障诊断方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant