CN114114410A

CN114114410A - 一种识别异常地震信号的方法

Info

Publication number: CN114114410A
Application number: CN202010893043.2A
Authority: CN
Inventors: 张捷; 张基
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2020-08-28
Filing date: 2020-08-28
Publication date: 2022-03-01
Anticipated expiration: 2040-08-28
Also published as: CN114114410B

Abstract

本发明提供一种识别异常地震信号的方法，包括：S1，选取模板信号；S2，对模板信号进行匹配滤波处理，获取多个相似信号；S3，利用神经网络从地震记录中获取地震信号；S4，对模板信号、相似信号、地震信号进行降维处理，得到降维数据；S5，对降维数据进行聚类处理，确定降维数据的决策边界，将边界内的地震信号识别为与模板信号相似的异常地震信号。本发明提供的方法通过结合匹配滤波算法、神经网络和数据挖掘技术，能够从连续的地震波形记录中寻找相似的地震信号。

Description

一种识别异常地震信号的方法

技术领域

本发明涉及地震信号识别领域，具体涉及一种利用传统匹配滤波结合人工智能神经网络和计算机大数据挖掘算法识别异常地震信号的方法。

背景技术

地震是由于地球内部某个局部区域的介质构造突变而产生的，包括自然地震和人工地震。地震的发生是一种地球内部能量释放的过程。能量的释放是以地震波的形式传播和扩散的。从地震记录中获取各类不同的地震信号，对我们研究地震活动和认识地球内部构造有着重要意义。这些信号包括震前的前兆信号，震后的余震信号，人工爆炸信号，坍塌信号等，每一种信号的数字记录显示不同的特征，因而有可能识别。

在时间序列中检测与一个已知信号相似的信号，一个有效方法是对波形模板与输入数据的连续时间段进行互相关处理。在连续数据流中与模板信号高度相似的时间段将会得到很高相关函数的值，这样的过程称为匹配滤波器或匹配信号检测器(例如，参见vanTrees 1968)。Anstey(1966)在论文中证明了通过波形相关检测掩埋在噪声中的合成信号，该论文对信号相关在勘探地球物理学和其他领域的早期应用提供了非常全面的文献综述。应用匹配滤波器检测相似信号是一个有效方法，但对相似性要求比较高，实际数据中，从地震记录中获取与某一特定信号严格相似限制了可寻找的信号范围，实际问题中也往往需要寻找具有部分相似特征、且有一定变异的信号，如地震前兆作为一类特殊的信号可能存在共同特征，也有不同的特征。传统异常地震信号获取的方法是通过对某一特定信号进行波形匹配得到相关的地震信号作为相似信号，该方法需要设置相关系数的阈值，而且仅得到波形相似的信号。随着地震仪器精度的提高和计算机技术的发展，在地震记录中很多小震信号被人们记录检测到。人们需要一种方法可以高效全面的从连续的地震记录中挑选出与模板信号不同程度有关的地震信号。

人工智能卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习的代表算法之一。卷积神经网络具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类。随着深度学习理论的提出和数值计算设备的改进，卷积神经网络得到了快速发展，并被应用于计算机视觉、自然语言处理等领域。数据挖掘是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析是数据挖掘的主要任务之一。聚类是搜索簇的无监督学习过程，与分类不同，无监督学习不依赖预先定义的类或带类标记的训练实例，需要由聚类学习算法自动确定标记，而分类学习的实例或数据对象有类别标记。降维是指采用某种映射方法，将原高维空间中的数据点映射到低维度的空间中。通过降维算法来减少冗余信息所造成的误差，提高识别(或其他应用)的精度，而且可以寻找数据内部的本质结构特征。

这里我们提出一种异常地震信号检测方法。我们利用传统匹配滤波方法得到的信号作为模板信号，利用卷积神经网络实现地震信号与噪音的区分，利用降维和聚类的方法从地震信号中分离出与具有某一特征的地震信号。该方法可以适用于震前前兆信号，也可以用于震后的余震信号，或爆炸信号，坍塌信号等各种异常地震信号。

发明内容

(一)要解决的技术问题

针对上述问题，本发明提供了一种识别异常地震信号的方法，用于至少部分解决从连续的地震记录中挑选出与模板信号不同程度有关的地震信号等技术问题。

(二)技术方案

本发明一方面提供了一种识别异常地震信号的方法，包括：S1，选取模板信号；S2，对模板信号进行匹配滤波处理，获取多个相似信号；S3，利用神经网络从地震记录中获取地震信号；S4，对模板信号、相似信号、地震信号进行降维处理，得到降维数据；S5，对降维数据进行聚类处理，确定降维数据的决策边界，将边界内的地震信号识别为与模板信号相似的异常地震信号。

进一步地，S2中获取多个相似信号的事件的相关系数计算公式如下：

其中，NCC为相关系数，T为参考震相的时间窗口，震源项是辐射方向F与震源时间函数S(t)的乘积，F₁、S₁为其中一个事件的辐射方向和震源时间函数，F₂、S₂为另一个事件的辐射方向和震源时间函数，t0为当前计算的时刻；τ为时间变量，取值范围为(-T，T)。

进一步地，S3中利用神经网络从连续地震记录中获得地震信号具体包括：S31，通过全卷积神经网络提取信号包络线，同时压制信号前的噪音信号；S32，通过卷积神经网络对信号包络线进行分类，区分噪音信号与地震信号。

进一步地，S31具体包括：S311，输入地震台记录的一段波形数据，波形数据包括地震波形数据和背景噪音数据；S312，利用数据稀疏和高斯光滑算法，计算波形数据对应的包络线，作为预先建立的全卷积神经网络的标签；通过训练学习和全卷积神经网络处理获得波形数据与其对应包络线的非线性关系，提取新的波形数据包络线。

进一步地，S312中获取波形数据对应的包络线的计算公式如下，E为信号包络线，D(t)为时间序列数据，t_p为纵波到时，s(·)为高斯光滑函数。

进一步地，S32具体包括：S321，输入一段波形数据对应的包络线，包络线包括地震波形数据的包络线和背景噪音数据的包络线；S322，设置噪音包络线对应的标签为0，地震信号包络线对应的标签为1，作为预先建立的卷积神经网络的标签；通过训练学习和卷积神经网络处理区分输入的是噪音包络线还是地震信号包络线，从而区分地震信号与噪音信号。

进一步地，卷积神经网络包括卷积过程和全连接过程，卷积过程由7组网络层构成，全连接过程由5个全连接过程实现，最后一层网络采用激活函数Softmax，公式如下，用于将一个含任意实数的K维向量z压缩到另一个K维实向量σ(z)中，Z_j为该K维向量第j维的值，Z_k为K维向量第k维的值，k的取值范围维(1，K)。

进一步地，S4中降维处理包括利用T分布随机近邻嵌入非线性降维算法，T分布随机近邻嵌入通过将数据点间的欧几里德距离转化为条件概率而表征相似性，公式如下：

其中，P_j/i表示相似性，x_i为第i个数据点，x_j为第j个数据点，x_k为第k个数据点，k的取值范围(1，N)但不包括第i个数据点，σ_i是以数据点x_i为均值的高斯分布标准差。

进一步地，识别异常地震信号的方法还包括矩阵Y，Y是N*2阶矩阵，是数据集X的2维表征，对于高维数据点x_i和x_j在低维空间中的映射点y_i和y_j，计算相似的条件概率q_j/i，公式如下：

其中，y_i为高维数据点x_i对应的低维数据点，y_j为高维数据点x_j对应的低维数据点，y_k为高维数据点x_k对应的低维数据点，k的取值范围(1，N)但不包括第i个数据点；

选择Y中的数据点，令条件概率分布q近似于P，该步骤通过最小化两个分布之间的KL散度(损失函数)而实现，公式如下：

其中，p_i是高维空间里各个点的联合概率分布，q_i是低维空间下的各个点的联合概率分布，p_j/i为高维空间点x_i和x_j之间的相似度，q_j/i为低维空间点y_j和y_i之间的相似度；KL为相对熵，用于度量两个概率分布之间的差异程度。

进一步地，S5中采用K邻近聚类算法，划分出前兆信号的决策边界；训练样本为(x_i，x_j)，当输入实例为x，标记为c，N_k(x)是输入实例x的k近邻训练样本集，定义训练误差率是K近邻训练样本标记与输入标记不一致的比例，误差率表示为：

其中，x_i为特征向量，y_i为实例x_i的类别，c_j为第j个类别，N_k为在训练集中找出于x最近邻的k个点的领域，k为相邻的点数，I为指示函数，当y_i＝c_j为1，否则为0。

(三)有益效果

本发明实施例提供的一种识别异常地震信号的方法，通过利用传统匹配滤波结合人工智能神经网络和计算机大数据挖掘算法寻找异常地震信号的方法，一个应用领域是寻找大震前异常信号，从而可能预测较大地震的发生。

附图说明

图1示意性示出了根据本发明实施例识别异常地震信号的方法的流程图；

图2示意性示出了根据本发明实施例芦山地震的位置和地震台站以及其他地震事件的分布；

图3示意性示出了根据本发明实施例识别异常地震信号中单台站匹配滤波的结果；

图4示意性示出了根据本发明实施例利用神经网络从连续地震记录中获得地震信号的流程图；

图5示意性示出了根据本发明实施例通过全卷积神经网络提取信号包络线的流程图；

图6示意性示出了根据本发明实施例识别异常地震信号的方法中全卷积神经网络的的结构流程图；

图7示意性示出了根据本发明实施例识别异常地震信号的方法中全卷积神经网络的结果；

图8示意性示出了根据本发明实施例通过卷积神经网络对信号包络线进行分类，区分噪音信号与地震信号的流程图；

图9示意性示出了根据本发明实施例识别异常地震信号的方法中卷积神经网络的结构流程图；

图10示意性示出了根据本发明实施例卷积神经网络在训练过程中损失函数的迭代曲线；

图11示意性示出了根据本发明实施例卷积神经网络在训练过程中准确率的迭代曲线；

图12示意性示出了根据本发明实施例卷积神经网络结果的混淆矩阵；

图13示意性示出了根据本发明实施例数据降维过程2维空间中各类信号的分布情况；

图14示意性示出了根据本发明实施例利用聚类算法得到的聚类边界结果；

图15示意性示出了根据本发明实施例识别异常地震信号的方法得到前兆信号每天的数量变化图；

图16示意性示出了根据本发明实施例识别异常地震信号的方法具体流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

地震事件是地球内部在某个局部区域产生的介质构造突变而发生的。地震事件是由地下的岩石构造瞬间破裂所造成的。地震波数据是一个时间序列信号。每一个地震都对应着一个独特的地震波形图，如纵波，横波，面波以及地震波到达地震台站的时间。地震台站或者地震仪记录到的是地震发生后地震波传播到记录地点所引起的介质的位移，或者位移的速度(一阶时间导数)，或者位移的加速度(二阶时间导数)。一般地震台可采用三分量(垂直，东西，南北方向震动记录)地震图数据。

在地震学领域，地震模拟中存在一个基本假设：如果同一个地震监测台站记录的两个地震波数据相关系数值很高，那么这两个地震对应的震源以及它们传播过程的速度结构也应该是相似的。因此，在地震学领域，利用波形匹配器来寻找相似的地震，从而找到有关联的地震事件，例如可以参见Gibbons，S.J.，&Ringdal，F.(2006).The detection oflow magnitude seismic events using array-based waveformcorrelation.Geophysical Journal International，165(1)，149-166，以及Zhang，M.，&Wen，L.(2015).An effective method for small event detection：match and locate(M&L).Geophysical Journal International，200(3)，1523-1537。

卷积神经网络仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征，例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程要求。在地震学领域，对于高信噪比的地震记录，地震波形与噪音信号有着明显的视觉区别，地震波形有着相对突出纵波，横波，面波信号特征，利用卷积神经网络实现噪音与地震事件识别，例如可以参见Zhou，Y.，Yue，H.，Kong，Q.，&Zhou，S.(2019).Hybrid event detectionand phase-picking algorithm using convolutional and recurrent neuralnetworks.Seismological Research Letters，90(3)，1079-1087.

针对卷积神经网络在图像精细分割上存在的局限性，UC Berkeley的JonathanLong等人2015年在其论文Fully convolutionalnetworks for semantic segmentation(用于语义分割的全卷积神经网络)中提出了全卷积神经网络用于图像的分割，要解决的核心问题就是图像像素级别的分类。全卷积神经网络可以接受任意尺寸的输入图像，采用反卷积层对最后一个卷积层的特征图进行上采样，使它恢复到输入图像相同的尺寸，从而可以对每个像素都产生了一个预测，同时保留了原始输入图像中的空间信息，最后在上采样的特征图上进行逐像素分类。在地震学领域，利用全卷积神经网络获得地震信号的纵波，横波震相的概率曲线，例如可以参见Zhu，W.，&Beroza，G.C.(2019).PhaseNet：a deep-neural-network-based seismic arrival-time picking method.Geophysical JournalInternational，216(1)，261-273。

T分布随机近邻嵌入是一种用于降维的机器学习方法，它能帮我们识别相关联的模式。T分布随机近邻嵌入主要的优势就是保持局部结构的能力，这意味着高维数据空间中距离相近的点投影到低维中仍然相近；同样能生成漂亮的可视化，可参考Maaten，L.V.D.，&Hinton，G.(2008).Visualizing data using t-SNE.Journal of machine learningresearch，9(Nov)，2579-2605。在地震学领域，人们利用T分布随机近邻嵌入结合自编码器实现区域地震与远震的识别，参考Mousavi，S.M.，Zhu，W.，Ellsworth，W.，&Beroza，G.(2019).Unsupervised clustering of seismic signals using deep convolutionalautoencoders.IEEE Geoseience and Remote Sensing Letters，16(11)，1693-1697。

K邻近算法是选择与输入样本在特征空间内最近邻的k个训练样本并根据一定的决策规则，给出输出结果。该算法简单，理论成熟，可用于分类和回归；对异常值不敏感；比较适用于容量较大的训练数据，容量较小的训练数据则很容易出现误分类情况。

根据本发明实施例，我们结合匹配滤波算法，神经网络和数据挖掘技术，从连续的地震波形记录中寻找相似的地震信号。匹配滤波器可以帮助我们建立模板信号；我们利用神经网络可以高效地从连续的地震记录中获得地震事件；通过数据降维和聚类分析，我们可以从低维空间寻找更多的相似信号作为异常地震信号。

本发明的实施例提供了一种识别异常地震信号的方法，请参见图1，包括：S1，选取模板信号；

S2，对模板信号进行匹配滤波处理，获取多个相似信号；

S3，利用神经网络从地震记录中获取地震信号；

S4，对模板信号、相似信号、地震信号进行降维处理，得到降维数据；

S5，对降维数据进行聚类处理，确定降维数据的决策边界，将边界内的地震信号识别为与模板信号相似的异常地震信号。

下面通过一个震前的前兆信号获取的实际数据测试验证所述方法的有效性，并一一对上述步骤进行详细说明，该实例采用来自中国四川Ms7.0芦山地震数据，图2展示芦山地震的位置和地震台站以及其他地震事件的分布，五角星为芦山地震，三角形为地震台站，黑色的圆圈为其他地震事件。

(1)震前的前兆信号

自然地震是一种对人类社会有着巨大影响的自然灾害，评价和应对地震灾害是人类社会面对的重大挑战。目前，地震预警是一种相对有效的规避地震灾害的方法，但是这种方法使用条件是地震已经发生，通过不同地震波的到时差来提前几秒或者几十秒进行地震预警。地震前兆是大震发生前的异常信号，并且这类信号与大震有着密切的关系，利用这类信号可以指导人们对地震进行预测。前兆信号包括地震信号，水位信号，大气信号和动物信号等，这里主要讨论和研究的是地震信号。地震前兆信号的检测，可以为地震预测提供有力的支持，规避地震灾害造成的生命财产损失的风险。

(2)匹配滤波器获得模板信号

首先，需要人工选取一部分与大震有关的前震信号，作为匹配滤波所需要的模板信号，即为操作S1中的选取模板信号，这里匹配方法可以是匹配滤波方法，或者是其他的波形相似算法；该方法除了可以获取地震前兆信号，还可以获得某一类具有独特特征的信号，例如余震信号，爆炸信号，或坍塌信号等各种异常信号；该方法中间过程的数据分析方法，可以作为单独地震信号的提取方法。利用匹配滤波器对大震发生前的信号进行处理，得到更多的前兆样本信号，即为操作S2。震源项是辐射方向F与震源时间函数S(t)的乘积，事件的相关系数计算方法可以用公式(a)表示，NCC为相关系数，T为参考震相的时间窗口。当两个事件非常接近地发生时，只有源时间函数的差异和震源辐射图的极性差异会影响一个站的CC值。当两个事件具有相同的震源时间函数和相同的辐射方向图时，CC值为1；当两个事件的震源时间函数不同时，CC值将小于1。如上所述，具有不同震源时间函数的事件之间的互相关图具有较低的CC值；提高CC阈值震源时间函数相似事件可被检测到。图3为利用匹配滤波方法得到的一个地震台站三分量的结果，中间红色段为人工选取的前兆信号，灰色是连续的波形，它们重叠部分为匹配的地震信号。通过这个匹配过程，我们可以获得与模板信号相似的地震波形。

(3)神经网络获得地震信号

利用神经网络从连续地震记录中获得地震信号，该神经网络包括卷积神经网络CNN，全卷积神经网络FCN，对抗神经网络GAN，循环神经网络RNN中的一种或几种的组合，即操作S3，还包含利用全卷积神经网路获取异常信号的包络线和利用卷积神经网路获取识别地震信号包络线两部分组成，请参见图4。

(4)全卷积神经网路获取异常信号的包络线

根据本发明实施例，提出了一种基于全卷积神经网络实现对信号包络线的提取，同时压制信号前的噪音信号的方法，请参见图5，包括：S311，输入地震台记录的一段波形数据，波形数据包括地震波形数据和背景噪音数据；S312，利用数据稀疏和高斯光滑算法，计算波形数据对应的包络线，作为预先建立的全卷积神经网络的标签；通过训练学习，全卷积神经网络可以获得波形数据与其对应的包络线的非线性关系，从而实现对新的波形数据包络线的提取。

根据台站背景噪音的阈值，从连续的地震记录中刷选出异常信号。利用全卷积神经网路获取异常信号的包络线，图6为全卷积神经网络的网络结构图，输入是全卷积神经网络得到的包络线，输出是标签0和1，其中0代表是噪音数据，1代表是地震事件。该网络分为下采样过程和上采样过程，卷积层和平均池化层为一组网络层，下采样过程由7组网络层构成；上采样过程也同样有7组网络层构成；这样可以使输出结果恢复到与输入样本相同的维度。同时，卷积层采用的边缘补零的方法，保证卷积过程中不改变数据的大小。输入的信号是地震波形，输出的是该信号的包络线；E为信号包络线，D(t)为时间序列数据，t_p为纵波到时，s(·)为高斯光滑函数。包络线的公式(b)，表明我们强制纵波初至时间前的信号包络线为0，纵波初至时间后的信号包络线由稀疏算法和高斯光滑算法获得。具体为我们把时间序列数据的分割为N份，取每一份最大值作为稀疏值，利用高斯光滑的算法对稀疏值再进行插值，获得与原始信号维度相同的包络线。

通过对2万多个地震信号和噪音包络线的学习，该网络可以得到任何信号的包络线，图7(a)为训练过程中训练集和验证集损失函数的迭代曲线，误差接近于0并趋于稳定；图7(b)，(c)，(d)为该网络的预测结果，红色为该网络预测的包络线，蓝色为传统方法得到的包络线。全卷积神经网络可以实现一个非线性的拟合，可以压制初至波前的噪音信号，即为操作S31。而且这个过程不需要我们手动的拾取初至波的到时，为后面卷积神经网络实现信号分类提供了很好的样本。

(5)卷积神经网路获取识别地震信号

根据本发明实施例，提出了一种基于卷积神经网络实现对信号包络线的分类，区分噪音与地震信号的方法，请参见图8，包括：S321，输入一段波形数据对应的包络线，包络线包括地震波形数据的包络线和背景噪音数据的包络线；S322，设置噪音包络线对应的标签为0，地震信号包络线对应的标签为1，作为预先建立的卷积神经网络的标签；通过训练学习，卷积神经网络可以区分输入的是噪音包络线还是地震信号包络线，从而实现地震信号与噪音的区分。

异常信号的包络线作为卷积神经网络输入信号，利用卷积神经网络实现地震信号和噪音的分离，即为操作S32。图9为卷积神经网络的网络结构图，输入是全卷积神经网络得到的包络线，输出是标签0和1，其中0代表是噪音数据，1代表是地震事件；由卷积过程和全连接过程构成。卷积层和平均池化层为一组网络层，卷积过程由7组网络层构成；全连接过程由5个全连接过程实现。因为该过程是分类过程，我们最后一层网络采用的激活函数是Softmax并只包含两个神经元，最后输出结果表示对应类别的概率。输出层的数值通过激活函数Softmax映射到0-1区间，将神经元输出构造成概率分布，用于多分类问题中，Softmax激活函数映射值越大，则对应类别可能性越大，公式(c)为Softmax函数。它能将一个含任意实数的K维向量z压缩到另一个K维实向量σ(z)中，使得每一个元素的范围都在(0，1)之间，并且所有元素的和为1。

其中，Z_j为该K维向量第j维的值，Z_k为K维向量第k维的值，k的取值范围维(1，K)。

设置地震信号对应的标签为1，噪音对应的标签为0；图10为该网络训练过程中训练集和验证集损失函数的迭代曲线，经过50代的学习训练，误差趋于稳定；图11为该网络训练过程中训练集和验证集准确率的迭代曲线，验证集和训练集的准确率可以达到99％。为了进一步验证该网络的分类效果，图12为分类结果的混淆矩阵，其中横向加和代表实际标签对应的数量，纵向加和代表预测标签对应的数量，通过该图可以得到对于噪音和事件绝大多数的分类是准确的，整体的准确率很好，对于每一类单独的分类效果也是很好的，只有极少的信号分类错误。

(6)T分布随机近邻嵌入实现数据降维

随后，利用神经网络得到的地震信号和匹配滤波方法得到的前兆信号以及人工挑选的前兆信号作为降维算法输入信号，利用T分布随机近邻嵌入这种非线性降维算法把输入数据降低到2维空间，即为操作S4，该降维算法包括主成分分析PCA，等线性降维方法，t-SNE，等非线性降维方法。假设我们有数据集X，它共有N个数据点。每一个数据点x_i的维度为D，我们希望降低为d维。在一般用于可视化的条件下，d的取值为2，即在平面上表示出所有数据。T分布随机近邻嵌入通过将数据点间的欧几里德距离转化为条件概率而表征相似性(下文用P_j/i表示)，如公式(d)所不：

如果以数据点在x_i为中心的高斯分布所占的概率密度为标准选择近邻，那么P_j/i就代表x_i将选择x_j作为它的近邻。对于相近的数据点，条件概率P_j/i是相对较高的，然而对于分离的数据点，P_j/i几乎是无穷小量。其中σ_i是以数据点x_i为均值的高斯分布标准差。现在引入矩阵Y，Y是N*2阶矩阵，即输入矩阵X的2维表征。基于矩阵Y，我们可以构建一个分布q，其形式与p类似。对于高维数据点x_i和x_j在低维空间中的映射点y_i和y_j，计算一个相似的条件概率q_j/i是可以实现的。我们将计算条件概率q_i/j中用到的高斯分布的方差设置为1/2。因此我们可以对映射的低维数据点y_j和y_i之间的相似度进行建模，如公式(e)所示：

其中，y_i为高维数据点x_i对应的低维数据点，y_j为高维数据点x_j对应的低维数据点，y_k为高维数据点x_k对应的低维数据点，k的取值范围(1，N)但不包括第i个数据点。

我们的总体目标是选择Y中的数据点，然后其令条件概率分布q近似于p。这一步可以通过最小化两个分布之间的KL散度(损失函数)而实现，这一过程可以定义为公式(f)：

C＝∑_iKL(p_i||q_i)＝∑_i∑_jp_j/ilog(p_j/i/q_j/i) (f)

使该损失函数最小化，使用梯度下降进行迭代更新，从而实现D维数据降为d维数据。图13为2维空间中各类信号的分布情况，不同颜色不同形状的符号代表不同类别信号，叉号代表神经网络得到的地震事件，圆圈代表人工挑选的前兆信号和加号代表匹配滤波得到相似信号降维到2维的结果。

(7)K邻近算法获得决策边界

最后利用K邻近聚类算法，划分出前兆信号的决策边界，即为操作S5，该聚类方法，可以是邻近聚类KNN，K-mean等基于距离，基于密度或者基于概率的降维算法。训练样本为(x_i，x_j)，当输入实例为x，标记为c，N_k(x)是输入实例x的k近邻训练样本集。定义训练误差率是K近邻训练样本标记与输入标记不一致的比例，误差率表示为：

因此，要使误差率最小化即经验风险最小，就要公式(g)右端最大，即K近邻的标记值尽可能的与输入标记一致，多数表决规则等价于经验风险最小化，通过这过程把相近的数据划分为同一类。图14为利用聚类算法得到的聚类边界结果，紫色背景的区域为前兆信号的区域，在这个区域内的信号有着相似的特征，因此在这个区域的地震事件也同样是前兆信号，从而实现前兆信号的提取。

考虑到数据量、运行内存和降维算法的问题，对所有的地震数据，按天为单位实现数据的降维和聚类处理，得到每天的前兆信号，图15展示的是该方法得到前兆信号每天数量的变化图。通过观测每天前兆信号的变化趋势，可以发现在大震发生前一星期左右前兆信号会增加，这类信号可以作为地震预测的一个判断标准。

以上完整异常地震信号检测方法请参见图16，具体的流程包括以下步骤：

1)人工挑选某一类信号并作为匹配滤波方法的模板信号；

2)利用模板匹配法得到相似信号作为降维数据的一类输入；

3)通过设置噪音阈值从连续的地震记录中得到异常信号，并利用全卷积神经网络和卷积神经网络技术网络，进一步清洗数据，去掉噪音信号得到地震信号；

4)对人工挑选的信号，匹配滤波得到的信号和从连续地震记录中筛选的地震信号一起做降维处理，并利用邻近聚类算法进行聚类得到决策边界；

5)在决策边界内的地震信号是在低维空间与前兆信号有相似特征的信号，是该算法得到的相似地震信号。

综上所述，本发明通过结合匹配滤波，全卷积神经网络，卷积神经网络，数据降维算法和聚类算法来实现包括：全卷积神经网络实现对信号包络线的提取，同时压制信号前的噪音信号；卷积神经网络实现对信号包络线的分类，区分噪音与地震信号；降维和聚类算法实现多维信号在低维空间的相似性分析。

其中一种基于全卷积神经网络实现对信号包络线的提取，同时压制信号前的噪音信号的方法，包括：输入地震台记录的一段波形数据，波形数据包括地震波形数据和背景噪音数据；利用数据稀疏和高斯光滑算法，计算波形数据对应的包络线，作为预先建立的全卷积神经网络的标签；通过训练学习，全卷积神经网络可以获得波形数据与其对应的包络线的非线性关系，从而实现对新的波形数据包络线的提取。

其中一种基于卷积神经网络实现对信号包络线的分类，区分噪音与地震信号的方法，包括：输入一段波形数据对应的包络线，包络线包括地震波形数据的包络线和背景噪音数据的包络线；设置噪音包络线对应的标签为0，地震信号包络线对应的标签为1，作为预先建立的卷积神经网络的标签；通过训练学习，卷积神经网络可以区分输入的是噪音包络线还是地震信号包络线，从而实现地震信号与噪音的区分。

其中一种基于降维和聚类算法实现多维信号在低维空间的相似性分析的方法，包括：输入人工选取的异常地震信号；输入匹配滤波器获得的相似信号；输入基于神经网络获得的地震事件信号；利用降维算法，对输入数据进行降维处理，实现从高维数据降低至二维数据，并在二维空间显示；通过聚类算法计算二维数据的决策边界，相似数据在某一特定的区域，从而实现高维数据在低维空间的相似性分析。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种识别异常地震信号的方法，包括：

S1，选取模板信号；

S2，对所述模板信号进行匹配滤波处理，获取多个相似信号；

S3，利用神经网络从地震记录中获取地震信号；

S4，对所述模板信号、相似信号、地震信号进行降维处理，得到降维数据；

S5，对降维数据进行聚类处理，确定所述降维数据的决策边界，将边界内的所述地震信号识别为与所述模板信号相似的异常地震信号。

2.根据权利要求1所述的识别异常地震信号的方法，其特征在于，所述S2中获取多个相似信号的事件的相关系数计算公式如下：

3.根据权利要求1所述的识别异常地震信号的方法，其特征在于，所述S3中利用神经网络从连续地震记录中获得地震信号具体包括：

S31，通过全卷积神经网络提取信号包络线，同时压制信号前的噪音信号；

S32，通过卷积神经网络对信号包络线进行分类，区分噪音信号与地震信号。

4.根据权利要求3所述的识别异常地震信号的方法，其特征在于，所述S31具体包括：

S311，输入地震台记录的一段波形数据，波形数据包括地震波形数据和背景噪音数据；

S312，利用数据稀疏和高斯光滑算法，计算波形数据对应的包络线，作为预先建立的全卷积神经网络的标签；通过训练学习和全卷积神经网络处理获得波形数据与其对应包络线的非线性关系，提取新的波形数据包络线。

5.根据权利要求4所述的识别异常地震信号的方法，其特征在于，所述S312中获取波形数据对应的包络线的计算公式如下，E为信号包络线，D(t)为时间序列数据，t_p为纵波到时，s(·)为高斯光滑函数。

6.根据权利要求3所述的识别异常地震信号的方法，其特征在于，所述S32具体包括：

S321，输入一段波形数据对应的包络线，包络线包括地震波形数据的包络线和背景噪音数据的包络线；

S322，设置噪音包络线对应的标签为0，地震信号包络线对应的标签为1，作为预先建立的卷积神经网络的标签；通过训练学习和卷积神经网络处理区分输入的是噪音包络线还是地震信号包络线，从而区分地震信号与噪音信号。

7.根据权利要求3所述的识别异常地震信号的方法，其特征在于，所述卷积神经网络包括卷积过程和全连接过程，所述卷积过程由7组网络层构成，所述全连接过程由5个全连接过程实现，最后一层网络采用激活函数Softmax，公式如下，用于将一个含任意实数的K维向量z压缩到另一个K维实向量σ(z)中，Z_j为该K维向量第j维的值，Z_k为K维向量第k维的值，k的取值范围维(1，K)。

8.根据权利要求1所述的识别异常地震信号的方法，其特征在于，所述S4中降维处理包括利用T分布随机近邻嵌入非线性降维算法，T分布随机近邻嵌入通过将数据点间的欧几里德距离转化为条件概率而表征相似性，公式如下：

9.根据权利要求1所述的识别异常地震信号的方法，其特征在于，还包括矩阵Y，Y是N*2阶矩阵，是所述数据集X的2维表征，对于高维数据点x_i和x_j在低维空间中的映射点y_i和y_j，计算相似的条件概率q_j/i，公式如下：

其中，p_i是高维空间里各个点的联合概率分布，q_i是低维空间下的各个点的联合概率分布，p_j/i为高维空间点x_i和x_j之间的相似度，q_j/i为低维空间点y_j和y_i之间的相似度；K_L为相对熵，用于度量两个概率分布之间的差异程度。

10.根据权利要求1所述的识别异常地震信号的方法，其特征在于，所述S5中采用K邻近聚类算法，划分出前兆信号的决策边界；训练样本为(x_i，x_j)，当输入实例为x，标记为c，N_k(x)是输入实例x的k近邻训练样本集，定义训练误差率是K近邻训练样本标记与输入标记不一致的比例，误差率表示为：