CN113361476A

CN113361476A - 一种基于人工智能技术的张衡一号震前异常信号识别方法

Info

Publication number: CN113361476A
Application number: CN202110753558.7A
Authority: CN
Inventors: 熊攀
Original assignee: INSTITUTE OF EARTHQUAKE SCIENCE CHINA EARTHQUAKE ADMINISTRATION
Current assignee: INSTITUTE OF EARTHQUAKE SCIENCE CHINA EARTHQUAKE ADMINISTRATION
Priority date: 2021-07-02
Filing date: 2021-07-02
Publication date: 2021-09-07
Anticipated expiration: 2041-07-02
Also published as: CN113361476B

Abstract

本发明公开了一种基于人工智能技术的张衡一号震前异常信号识别方法，包括S1：卫星数据获取及预处理，S2：电离层地震异常识别模型建立，S3：利用迁移学习构建张衡一号多参数地震异常识别模型，S4：地震监测应用效能评价。与现有技术相比，本发明的有益效果是：将已经学到的、训练好的震前异常识别模型参数通过迁移学习，构建基于张衡一号卫星的地震异常识别新模型；最后，利用张衡一号实测数据开展地震遥感监测应用，依据应用效能评价反馈，调整模型参数、优化模型，能提取震前张衡一号卫星的异常信息。

Description

一种基于人工智能技术的张衡一号震前异常信号识别方法

技术领域

本发明涉及卫星震前异常信号识别技术领域，具体为一种基于人工智能技术的张衡一号震前异常信号识别方法。

背景技术

2004年6月，法国发射第一颗专门用于监测地震与火山电离层扰动的卫星DEMETER，卫星在轨运行6年，为地震电离层提供了宝贵的数据资源，迄今为止，基于这颗卫星发表的文章已经超过300篇，其中针对地震异常研究的论文130余篇。我国于2018年2月成功发射了张衡一号电磁地震卫星，标志着我国成为拥有空间地球物理场探测卫星的国家之一，张衡一号电磁卫星发射至今，中国电磁卫星团队全方位开展了电磁卫星数据分析及地震应用研究，目前还没有一套完善高效的张衡一号震前异常信号识别方法。

发明内容

本发明的目的在于提供一种基于人工智能技术的张衡一号震前异常信号识别方法，以解决的问题。

为实现上述目的，本发明提供如下技术方案：包括S1：卫星数据获取及预处理，S2：电离层地震异常识别模型建立，S3：利用迁移学习构建张衡一号多参数地震异常识别模型，S4：地震监测应用效能评价；

S1步骤：选取能够反映各圈层地震前电离层异常变化的法国DEMETER电磁卫星和张衡一号卫星参数，所述卫星参数包括运行轨迹和卫星数据，空间范围为全球，每个地震选取的数据初始时间长度为震前15天到震后5天，初始空间范围为距离震中Dobrovolsky距离(R＝10^0.43M)范围内，另外选取全球范围、时空均匀分布的模拟地震(“非震事件”)，选取数据的时间、空间范围与真实地震一致，利用“滑动时间窗”分别获取电子密度、电子温度的原始时间序列，并利用深度学习网络自动学习特征，初始研究的滑动窗长度(连续数据点)设置为20，形成非重叠的时序滑动窗数据，剔除任一数据对应磁情指数Kp大于3.0的滑动窗；

S2步骤：经过步骤S1的数据预处理后，基于CNN-BiLSTM深度学习网络建立DEMETER卫星电离层多参数地震异常识别模型，提取模型学习的地震与非震特征，基于IBPT分类器构建地震异常识别深度学习模型，对2005年到2010年法国DEMETER电磁卫星的电离层多参数时序特征样本进行训练建模，按照地震发生的时间顺序，前80％地震对应的样本数据作为训练集，后20％的地震对应的样本数据作为测试集,利用CNN-BiLSTM深度学习模型的神经网络直接通过电离层多参数时序数据自动学习特征，利用初始层数为3的CNN网络层提取局部平行特征，采用由多个记忆模块构成的BiLSTM模型对长距离依赖特征进行特征提取，序列学习，每个模块由两个细胞的拓扑结构构成；最后通过全连接层和Softmax分类器获得分类结果，在此基础上，删除CNN-BiLSTM模型的最后两层，提取模型学习到的电离层多参数地震与非震特征，利用IBPT分类器模型，最终区分地震与非震特征；

S3步骤：对张衡一号卫星的多参数时序特征样本切分训练集和测试集，同样按照地震发生的时间顺序，前80％地震对应的样本数据作为训练集，后20％作为测试集，在此基础上，将已经学到的、训练好的基于DEMETER电磁卫星样本的CNN-BiLSTM深度学习模型参数，以及IBPT分类器模型参数迁移到张衡一号电磁卫星电离层多参数，形成新的分类模型，最后，利用得到的权重参数初始化其余网络层的参数，并通过调整损失函数、优化器函数等模型参数来来修正和提高模型准确率，构建新的地震异常识别模型；

S4步骤，基于优化的模型，利用在轨运行的张衡一号卫星实时观测数据，开展地震遥感监测应用，用实际震例验证模型，依据应用评价反馈，进而调节模型参数、优化模型，迭代反复进行，项目利用训练集训练模型，通过贝叶斯超参数优化方法构造一个函数的后验分布(高斯过程)描述要优化的函数，使得优化算法更加确定参数空间中哪些区域值得探索，哪些区域不值得探索，最后寻找使得模型在验证数据集上表现性能最佳的超参数组合，建立模型，开展地震监测应用，依据应用评价优化模型。

与现有技术相比，本发明的有益效果是：将已经学到的、训练好的震前异常识别模型参数通过迁移学习，构建基于张衡一号卫星的地震异常识别新模型；最后，利用张衡一号实测数据开展地震遥感监测应用，依据应用效能评价反馈，调整模型参数、优化模型，能提取震前张衡一号卫星的异常信息。

附图说明

图1为地震异常识别深度学习模型架构图。

具体实施方式

下面将结合本发明实施例，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

(1)法国DEMETER电磁卫星和张衡一号卫星数据获取及预处理

首先，项目结合前人的研究成果以及申请人研究基础，主要选取能够反映各圈层地震前电离层异常变化的法国DEMETER电磁卫星和张衡一号卫星参数，各参量的时空分辨参见下表。

其次，依据法国DEMETER电磁卫星和张衡一号卫星的在轨运行周期，各参数时间选取范围均为2005年到2010年全部法国DEMETER电磁卫星在轨运行数据、以及2019年到2020年张衡一号卫星数据，空间范围为全球。依据申请人前期研究基础，6.0级以上地震的多圈层、多参数异常变化较为明显，结合项目研究的时间范围，项目拟研究1280个全球6.0级以上地震。结合前人的研究成果，每个地震选取的数据初始时间长度为震前15天到震后5天，初始空间范围为距离震中Dobrovolsky距离(R＝10^0.43M)范围内。考虑非震异常的影响，项目避开选取的真实地震前后30天及震中500公里范围。另外选取全球范围、时空均匀分布的模拟地震(“非震事件”)，选取的初始数量为1280个，选取数据的时间、空间范围与真实地震一致。

在此基础上，因选取的电离层多参数(电子密度、电子温度)容易受到载荷交叉干扰等因素的影响而产生误差，项目利用“滑动时间窗”分别获取电子密度、电子温度的原始时间序列，并利用深度学习网络自动学习特征，避免手动提取特征，能够为地震与非震的识别提供更高精确度。初始研究的滑动窗长度(连续数据点)设置为20，形成非重叠的时序滑动窗数据。此外，因为磁暴等空间环境对电离圈层参数影响较大，项目剔除任一数据对应磁情指数Kp大于3.0的滑动窗。

(2)电离层地震异常识别模型建立

经过以上数据预处理后，项目基于CNN-BiLSTM深度学习网络建立DEMETER卫星电离层多参数地震异常识别模型，提取模型学习的地震与非震特征；最后，基于IBPT分类器构建地震异常识别深度学习模型，其网络模型架构如下。

项目对2005年到2010年法国DEMETER电磁卫星的电离层多参数时序特征样本进行训练建模，按照地震发生的时间顺序，前80％地震对应的样本数据作为训练集，后20％的地震对应的样本数据作为测试集。

首先，项目利用CNN-BiLSTM深度学习模型的神经网络直接通过电离层多参数时序数据自动学习特征。为了提取更全面的局部特征，先利用初始层数为3的CNN网络层(一维卷积层和池化层)提取局部平行特征；然后为了解决各属性特征点的前、后特征对该属性特征点的影响，采用由多个记忆模块构成的BiLSTM模型(双向长短时记忆层，初始层数为3)对长距离依赖特征进行特征提取，序列学习，每个模块由两个细胞的拓扑结构构成；最后通过全连接层和Softmax分类器获得分类结果，提高了准确率，降低了系统误报率。

CNN-BiLSTM模型结构主要由预处理层、卷积层、Bi-LSTM层和softmax层组成。

卷积层的主要作用是卷积层对V_s进行卷积操作，根据公式(10)产生新的特征

其中，f为ReLU函数：对于记录V_s中的记录的具体特征V_i进行卷机操作，为提取更加全面的局部特征，设置d个不同的卷积核大小W分别对V_i进行特征提取，W_d表示卷积核大小为d；b_d为偏置；

当特定卷积核大小完成V_s中的所有特征都卷积之后，输出特征为H^d公式如式(11)：

将所有卷积核大小的卷积操作得到的特征H^d进行叠加，得特征序列

池化层的主要作用是对特征序列H_s进行池化操作，具体采用平均池化的方法，具体过程如公式(12)所示：

预先给定一个块数M，将H^d划分成M个小块，将每个小块中的平均值进行拼接，由此得到一个特征向量p^dm，长度为M，对全部模块的平均值进行拼接得到

是第m_i块平均池化后得到的向量。

BiLSTM层的作用是为了捕获长距离依赖特征，将P_s输入到BiLSTM模型中，该模型由两个方向上的LSTM模块连接而成，具有多个共享权值；

在每个时间步上，BiLSTM模块的输出将由遗忘门(f_t)、输入门(i_t)、输出门(o_t)和一个细胞状态更新共同进行控制，每个门都由前一模块的输出b_t-1和当前时刻的输入p_t表示，三个门共同工作来完成对属性信息的选择、遗忘和细胞状态的更新；

在时间步t上，用BiLSTM模块的正向部分对p_t进行特征提取，公式如公式(13)：

在时间步t上，用BiLSTM模块的反向部分对进行特征提取，公式如公式(14)：

其中，σ是siogmod激活函数；tanh为双曲正切函数；*为元素乘运算，i_t是对输入信息进行选择操作，对信息的输入过程进行控制，f_t是对前一模块需要被遗忘的信息进行遗忘操作，对信息遗忘过程进行控制，c_t用来判断哪些信息应该存储到当前细胞状态，完成对信息的存储进行控制，o_t则是输出门对输出信息进行选择，对输出的信息进行控制；

在时间步t上，BiLSTM层最终输出的特征向量P_t为：

P_t＝[正向LSTM,反向LSTM] (15)

为了获取更加准确的分类精度，将BiLSTM的输出结果输入到全连接层，在全连接层中，处理公示如公式(16)、(17)、(18)所示

u_t＝tanh(W_wP_t+b_w) (16)

v＝∑a_tP_t (18)

其中，u_t是P_t的属性表示，u_w为上下文向量，a_t为重要性权重，v表示对P_t的进行重要性加权求和得到的高级表示，u_w在训练过程中随机生成。

在此基础上，项目删除CNN-BiLSTM模型的最后两层，提取模型学习到的电离层多参数地震与非震特征。此方法是基于这样的假设：即通过分析大量地震及非震的电离圈层参数样本，训练的深度网络模型已可以辨识地震的重要特征。

最后，利用项目提出的IBPT(Inverse Boosting Pruning Trees)分类器模型，最终区分地震与非震特征。IBPT分类算法由申请人及其团队提出并将其应用于地震预测领域，取得了较好的效果。IBPT分类器的设计思路是基于传统的集成机器学习模型Adaboost，IBPT从两方面对Adaboost进行了改进：1)提出了一个加权的cost-complexity后剪枝的方法，应用所有训练样本并让决策树完全增长，然后通过计算决策树每个节点的基尼不纯度来生成一组备选的剪枝树组，之后再次利用全部的训练样本来评估每个备选剪枝树的训练误差，训练误差最小的树会被选为最终的剪枝树分类器；2)提出了一个新的boosting框架inverse boosting，为了降低某些噪声样本造成的分类干扰，在原先boosting的基础上，降低在上一颗剪枝树中分类错误样本的权重并增大分类正确的样本权重，更新完的样本权重树组会与所有训练样本进入下一次迭代并进行剪枝树生成，随后重复执行上述步骤，直到达到最大树数为止。前期的研究基础表明，利用IBPT算法(而非CNN-BiLSTM模型自身)作为分类器，能够表现出更高的分类精度。

IBPT算法如下：

3.3.1离散Adaboost

我们的分类算法是建立在Freud等人提出的离散Adaboost算法的基础上的。算法1提出了离散Adaboost的基本方案，该方案结合了许多简单假设(称为弱学习者)，为分类任务形成了强大的分类器。该算法可总结如下：(1)依次训练多个基本分类器，根据其训练误差εm分配权重值ln(βm)(2)将先前分类器分类错误的样本分配较高的权重wm+1，i，这将使分类器更加关注这些样本。(3)最后，将所有弱分类器与其权重组合以获得整体分类器G(X)。通常，Adaboost将决策转储(一个一级决策树)用作其基本估计量。但是，决策转储有时由于其结构简单(例如带有决策转储的Adaboost在复杂的数据集中表现不佳。在此，我们提出了在两个方面都优于标准Adaboost的逆向修剪树(IBPT)算法：(1)我们提高了基础分类器的拟合和泛化能力。(2)提出了一种新颖的提升结构，以减少贡献较小的数据的影响。

3.3.2逆向修剪树

在本节中，我们提出一种集成方法，该方法将改进的Adaboost算法与修剪决策树结合在一起进行分类。在这里，由于其灵活性和易用性，我们仍将决策树用作增强的基本估算器。决策转储经常遭受拟合不足的困扰，而一棵完整的“树”具有很高的方差。我们在这里考虑修剪树以增加系统通用性。在我们的算法中，我们首先应用所有训练样本并让决策树完全增长，然后修剪方法修剪树的某些分支，然后使用修改后的标准来评估系统性能修剪的树木和更新的权重。之后，将重复执行上述步骤，直到达到最大树数为止。为了制定我们的算法，我们在这里预先声明使用的符号。特别地，我们将训练数据集表示为L＝X₁,y₁,X₂,y₂....X_N,y_N在此，X_n是样本特征向量，y_n表示类别标签，N是样本数。我们使用D_m＝(w_m,i,w_m,i+1...),m＝1,2,...M,i＝1,2,...,N，N来表示每次迭代中样本权重的分布。M是估计量(迭代次数)，每个样本权重在归一化的第一次迭代中初始化为1/N。此外，我们使用φ_m和G_final(x)来表示第m个估算器的权重和最终分类器。

3.3.3搜索最佳修剪的树

在Adaboost的框架中，每个样本的权重值都会迭代更新。在项目中，我们提出了一种加权成本复杂度方法来构建成本复杂度值与样本权重之间的关系。独立的样本验证或交叉验证可以帮助我们选择最佳的修剪子树。在这里，我们将V折交叉验证用于加权成本复杂度修剪，因为这种方法可以在样本规模不太大时充分利用样本信息。

3.3.4反向助推结构

如算法1的第4步和第5步所示，Adaboost将训练误差ε_m用作基本估算器性能的评估标准，以设置估算器的权重并更新样本权重。但是ε_m不是修剪树木的一致标准。我们观察到，修剪过程中训练样本的误差ε_m不断增加，而当树较小时，测试样本的误差ε_m减小。测试样本的错误在大约150个叶节点的子树中达到最小，并在继续修剪树时开始增加。ε_m不是评估修剪树的性能的合适标准。实际上，当修剪后的树具有较低的训练误差时，应给予它们较高的估计权重。因此，我们现在提出一种新颖的增强结构，该结构将分类结果与相应的修剪后的树木相关联。

第一步，我们将完整的决策树拟合到训练数据L上，并对其进行修剪，以获得最佳的树形结构。接下来，我们用TE_α代替ε_m作为评估标准，因为TE_α真实反映了修剪过的树木的结果。估算器的权重可以如下更新，

当

时，由于当前的估计器无法始终保持分类性能，因此我们允许迭代过程提前一点点终止。

在下一步中，我们提出一种反向增强结构来更新样品重量。在每次迭代中，我们将分类错误的样本视为“令人不安的”项目，这可能会使修剪后的分支的估计量的判断模糊，并影响决策树的泛化能力。因此，样本权重可以更新为以下：

D_m+1＝(w_m+1,1,w_m+1,2......w_m+1,N),m＝1,2,...M

在上式中，归一化因子Z_m为

G_m(X_i)是修剪后的树G_m的X_i预测值，y_i代表样本X_i的真实性，并且I(G_m(X_i),y_i)定义为：

错误分类的样本的权重在减小，分类样本的权重在增加，这减少了“干扰”项的影响，这些项有助于在以后的迭代中对树进行重组。然后，我们使用具有更新的权重分布D_m+1的数据集L训练下一个估计量，设置估计量权重并迭代更新样本权重，以满足最大数量的估计量。最终的整体分类器将是：

所提出的算法基于逆增强修剪树，如算法2所示。

3.3.5收敛分析

收敛是分类器的描述性特征。在本节中，我们将密切关注拟议分类方法的收敛性，这表明修剪过程是模型自适应的，特别说明相关分类规则的收敛误差严格地是单调递减的。分析还表明，可以通过在数据中添加随机噪声或使用不同的估计量来保持收敛速度。

首先，上面的公式可以如下转换：

因此，最终分类器ε_final的训练误差如下所示：

当y_i≠G_final(X_i)时，

是因为如果exp(-t)≥1if t≤0。然后，我们有以下等式：

最后，上式可以表示为：

由于规范化，其中w_m+1,i是更新的权重，∑_iw_m+1,i＝1根据柯西-施瓦兹不等式，我们有：

训练误差ε_final的上限可描述为：

可以看出，当Z_m>1时，训练误差ε_final的上限严格单调递减。正如我们上面讨论的，∑_iw_m,i＝1假设Z_m>1，我们有：

其中w_r代表分类样品的重量，w_w是分类错误的样品的重量。当等式(19)满足时，我们确保Z_m>1。由于采用了逆增强结构，因此基本估算器误差必须小于0.5，并且错误分类的样本的权重会不断减小，我们使

根据上面的定义，我们有

并且exp(φ_m)>1。因此，上式始终成立，我们可以验证Z_m>1这表明我们提出的方法的训练误差随着估计数m的增加而严格单调减小，最终误差收敛到全局最小值。

(3)利用迁移学习构建张衡一号多参数地震异常识别模型

首先，项目对2019年到2020年张衡一号卫星的多参数时序特征样本切分训练集和测试集，同样按照地震发生的时间顺序，前80％地震对应的样本数据作为训练集，后20％作为测试集。

在此基础上，将已经学到的、训练好的基于DEMETER电磁卫星样本的CNN-BiLSTM深度学习模型参数，以及IBPT分类器模型参数(也可理解为模型学到的知识)迁移到张衡一号电磁卫星电离层多参数，形成新的分类模型。

最后，利用得到的权重参数初始化其余网络层的参数，并通过调整损失函数、优化器函数等模型参数来来修正和提高模型准确率，构建新的地震异常识别模型。

(4)地震监测应用效能评价

基于优化的模型，利用在轨运行的张衡一号卫星实时观测数据，开展地震遥感监测应用，用实际震例验证模型，依据应用评价反馈，进而调节模型参数、优化模型，迭代反复进行。

项目利用训练集训练模型，通过贝叶斯超参数优化方法构造一个函数的后验分布(高斯过程)描述要优化的函数，使得优化算法更加确定参数空间中哪些区域值得探索，哪些区域不值得探索，最后寻找使得模型在验证数据集上表现性能最佳的超参数组合，建立模型，开展地震监测应用，依据应用评价优化模型。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：包括S1：卫星数据获取及预处理，S2：电离层地震异常识别模型建立，S3：利用迁移学习构建张衡一号多参数地震异常识别模型，S4：地震监测应用效能评价；

S2步骤：经过步骤S1的数据预处理后，基于CNN-BiLSTM深度学习网络建立DEMETER卫星电离层多参数地震异常识别模型，提取模型学习的地震与非震特征，基于IBPT分类器构建地震异常识别深度学习模型，对2005年到2010年法国DEMETER电磁卫星的电离层多参数时序特征样本进行训练建模，按照地震发生的时间顺序，前80％地震对应的样本数据作为训练集，后20％的地震对应的样本数据作为测试集，利用CNN-BiLSTM深度学习模型的神经网络直接通过电离层多参数时序数据自动学习特征，利用初始层数为3的CNN网络层提取局部平行特征，采用由多个记忆模块构成的BiLSTM模型对长距离依赖特征进行特征提取，序列学习，每个模块由两个细胞的拓扑结构构成；最后通过全连接层和Softmax分类器获得分类结果，在此基础上，删除CNN-BiLSTM模型的最后两层，提取模型学习到的电离层多参数地震与非震特征，利用IBPT分类器模型，最终区分地震与非震特征；

2.根据权利要求1所述的一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：所述CNN-BiLSTM模型结构主要由预处理层、卷积层、Bi-LSTM层和softmax层组成，

卷积层的主要作用是卷积层对V_s进行卷积操作，根据公式(1)产生新的特征

当特定卷积核大小完成V_s中的所有特征都卷积之后，输出特征为H^d公式如式(2)：

池化层的主要作用是对特征序列H_s进行池化操作，具体采用平均池化的方法，具体过程如公式(3)所示：

是第m_i块平均池化后得到的向量。

在时间步t上，用BiLSTM模块的正向部分对p_t进行特征提取，公式如公式(4)：

在时间步t上，用BiLSTM模块的反向部分对进行特征提取，公式如公式(5)：

在时间步t上，BiLSTM层最终输出的特征向量P_t为：

P_t＝[正向LSTM，反向LSTM] (6)

为了获取更加准确的分类精度，将BiLSTM的输出结果输入到全连接层，在全连接层中，处理公示如公式(7)、(8)、(9)所示

u_t＝tanh(W_wP_t+b_w) (7)

v＝∑a_tP_t (9)

3.根据权利要求2所述的一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：BiLSTM模型包括双向长短时记忆层，初始层数为3。

4.根据权利要求1所述的一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：CNN网络层包括一维卷积层和池化层，初始层数为3。

5.根据权利要求1所述的一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：地震选取的数据初始空间范围不包括真实地震前后30天及震中500公里范围。

6.根据权利要求1所述的一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：所述IBPT算法包括：依次训练多个基本分类器，根据其训练误差εm分配权重值ln(βm)，将先前分类器分类错误的样本分配较高的权重wm+1，i，最后，将所有弱分类器与其权重组合以获得整体分类器G(X)，提出两个方面都优于标准Adaboost的逆向修剪树(IBPT)算法：一、提高了基础分类器的拟合和泛化能力，二、一种新颖的提升结构。

7.根据权利要求6所述的一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：所述逆向修剪树(IBPT)算法是指将将改进的Adaboost算法与修剪决策树结合在一起进行分类，将训练数据集表示为L＝X₁，y₁，X₂，y₂....X_N，y_N在此，X_n是样本特征向量，y_n表示类别标签，N是样本数，使用D_m＝(w_m，i，w_m，i+1...)，m＝1，2，...M，i＝1，2，...，N，N来表示每次迭代中样本权重的分布。M是估计量(迭代次数)，每个样本权重在归一化的第一次迭代中初始化为1/N，此外，使用φ_m和G_final(x)来表示第m个估算器的权重和最终分类器。

8.根据权利要求7所述的一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：所述IBPT算法还包括搜索最佳修剪的树，独立的样本验证或交叉验证可以帮助选择最佳的修剪子树，将V折交叉验证用于加权成本复杂度修剪，将原始学习样本集L随机分为V个子集L_v，v＝1，...，V，每个子集的训练集为L^(v)＝L-L_v，树T_max来自原始集合L，在每个子集L_v上构建完整的树。提出了决策树的成本函数，如下所示：

是树叶编号，C表示类别编号，类别c的样本定义为i_c，决策树的成本是所有叶子节点的基尼系数的总和。完整树的gini索引为零，因为每个叶节点仅包含一个类的样本。但是，在修剪过程中，将修剪后的节点的样本与其父节点合并后的基尼Gini({T}，{w})会增加。因此，Gini({T}，{w})并不是选择子树的好方法，因为它总是偏爱大型树。因此，惩罚项，正则化参数α和树叶

被添加到成本函数。新的成本函数定义如下：

R_α(t)＝Gini({t}，{w})+α·|t|

当α为常数且

时，惩罚项倾向于使用较小的树。随修剪而减少。

现在，成本函数的变化由R_α(T-T_t)-R_α(T)给出，其中T是完整树，T_t表示节点在t处的分支，而在节点t处修剪的树将为T-T_t。接下来，通过将R_α(T-T_t)等于节点t上分支的成本来计算内部节点上的修剪成本：

其中，

当α≥g(t)时，将通过成本函数值的减小来修剪分支T_t。修剪顺序从设置α＝argming(t)开始，以找到应该修剪的分支，并且将重复该过程，直到树只剩下根节点为止。这提供了具有相关的成本复杂度参数α的一系列子树

对于α，将修剪的子树

应用于预测第v个测试集中的估计，从而导致以下错误率：

其中i_miss表示错误分类的样本权重的指标，

是测试集L_v的样本权重，而

代表集L_v的错误分类率。因此，v的平均错误分类率为：

同时，定义α^*＝argmin_αTE_α，并通过修剪T_max直到

达到最小值，获得最佳修剪树。

9.根据权利要求8所述的一种基于人工智能技术的张衡一号震前异常信号识别方法，其特征在于：所述IBPT算法还包括反向助推结构，将原始学习样本集L随机分为V个子集L_v，v＝1，...，V，每个子集的训练集为L^(v)＝L-L_v，树T_max来自原始集合L，在每个子集L_v上构建完整的树。提出了决策树的成本函数，如下所示：