CN109738939B - 一种地震前兆数据异常检测方法 - Google Patents

一种地震前兆数据异常检测方法 Download PDF

Info

Publication number
CN109738939B
CN109738939B CN201811219615.8A CN201811219615A CN109738939B CN 109738939 B CN109738939 B CN 109738939B CN 201811219615 A CN201811219615 A CN 201811219615A CN 109738939 B CN109738939 B CN 109738939B
Authority
CN
China
Prior art keywords
data
prediction model
abnormal
training
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811219615.8A
Other languages
English (en)
Other versions
CN109738939A (zh
Inventor
蔡寅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201811219615.8A priority Critical patent/CN109738939B/zh
Publication of CN109738939A publication Critical patent/CN109738939A/zh
Application granted granted Critical
Publication of CN109738939B publication Critical patent/CN109738939B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明提出了一种地震前兆数据异常检测方法,所述方法包括:获取历史地震前兆数据集,进行数据预处理,将预处理后的数据集分为训练集、验证集和测试集三个子集;构建LSTM‑RNN预测模型;将所述训练集中的数据作为输入,进行所述预测模型的训练;用所述验证集的数据,检查训练过程中误差变化情况;根据所述损失函数,设定异常触发阈值;用测试集中数据对预测模型进行测试,根据对测试集中异常数据的识别率,对所述超参数的值进行调整;利用预测模型进行地震前兆数据异常检测。本方法能够对地震前兆数据中的各类异常进行识别并进行清晰描述与准确区分,并能够识别出人工不易觉察的异常信息。

Description

一种地震前兆数据异常检测方法
技术领域
本发明涉及地震数据检测领域,特别是指一种地震前兆数据异常检测方法。
背景技术
地震前兆的观测和前兆异常的识别是地震预报的基础。地震预报是根据地震前观测数据的异常变化对未来地震发展趋势进行的综合判定。因此,地震预报是高度依赖于观测技术与数据处理方法的交差学科。自2008年汶川8.0级与2011年日本9.0级地震之后,大量学者通过前兆观测数据的分析,揭示了数据异常变化与地震孕育发生的关系。总结各类前兆数据异常主要可以分为趋势转折与高频扰动。趋势转折是观测数据在自身正常周期性变化过程中的趋势异常变化。高频扰动则是指观测数据突然出现的高频率、大振幅的异常数据,且规律性不明显。在实际观测过程中,这两类异常往往叠加出现,增加了对异常判定的复杂度。同时,受到观测台站周边地质构造、观测环境等多种因素的影响,观测数据的正常动态变化形态往往是多种多样的,同一观测台站在不同地震前的异常数据特征也不尽相同。
目前前兆数据分析的方式以分析预报人员的经验积累与直观检测为主,配合一些以统计学为基础的数学方法,通过对数据的变化形态的判断与归纳,外推确定是否是存在异常数据。经验模态分解、小波变换等数字信号处理方法也被用于异常数据的提取,这些方法将观测数据由时间域转换到频率域,从信号的细节角度对数据进行深入分析,捕捉异常。上述各种方法仅适用于某一类的异常识别,然而在实际观测过程中,各类异常往往叠加出现,现有方法难以完成对各类异常的统一识别、清晰描述与准确区分。因此,提出一种新的地震前兆数据异常检测方法是非常有必要的。
发明内容
本发明提出一种地震前兆数据异常检测方法,以实现对地震前兆数据的异常进行清晰准确的识别。
本发明的技术方案是这样实现的:所述方法包括:
S1、地震前兆数据处理;查询数据库,获取已存储的历史地震前兆数据集,根据指令进行数据预处理,将预处理后的数据集分为训练集、验证集和测试集三个子集;
S2、构建LSTM-RNN预测模型;所述预测模型分为输入层、隐藏层及输出层;其中,所述训练集作为预测模型的输入;所述隐藏层为多层,相邻之间采用全连接的方式;所述输出层为一个全连接层,其神经元的个数与需要向后预测的数据长度一致,采用线性激活方式;在所述预测模型中采用均方误差作为损失函数;
S3、训练预测模型;将所述训练集中的数据作为输入,通过指令运用通过时间的反向传播算法,进行所述预测模型的训练,其中,首先初步设定预测模型超参数的初始值,然后使用贝叶斯优化去寻找超参数的最优解;
S4、预测模型参数调整;根据所述损失函数,设定异常触发阈值;用测试集中数据对预测模型进行测试,根据对测试集中异常数据的识别率,对所述超参数的值进行调整,直到对测试集中异常数据识别的误差值和所触发的非异常数据的数量都达到期望值时结束;
S5、保存预测模型;用所述验证集的数据,检查训练过程中误差变化情况,当训练集与验证集的误差均达到最小期望值时结束,保存预测模型及损失函数;
S6、利用预测模型进行地震前兆数据预测;输入当前的地震前兆数据至所述预测模型,输出预测值,根据程序指令与异常触发阈值进行比较,判定是否为异常数据。
优选的,所述数据预处理为对地震前兆数据进行zero-mean标准化处理。
优选的,所述训练集由正常变化数据组成;所述验证集由随机选取的5%的训练集数据组成;所述测试集由正常变化数据和异常变化数据组成。
优选的,在所述隐藏层中,根据数据集的信息量和网络规模,设定dropout参数,随机抑制部分神经元的输出,以避免训练过程中出现过拟合现象,使所有神经元得到更加充分的训练。
优选的,所述dropout参数的数值与数据集的信息量负相关,与网络规模正相关。
优选的,所述预测模型超参数包括:隐藏层数、每层神经元数量、dropout、learning rate、epoch、batch_size。
优选的,所述损失函数为:
Figure BDA0001834436380000031
其中,yi(t)为t时刻模型输出的预测值,
Figure BDA0001834436380000032
为t时刻实际观测值。
优选的,所述异常触发阈值设定为2倍平均误差。
本发明同背景技术相比所产生的有益效果:
(1)LSTM-RNN方法有效缓解了梯度消失的问题,检测方法适用于不同长度数据集的异常提取;
(2)本发明提供的检测方法不仅能够判断异常类型,而且可以对异常数据进行定量化描述,消除了人为因素的影响,能够识别出人工不易觉察的异常信息;
(3)预测模型能够利用新增数据进行不断学习,从而提高预测准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所公开的一种地震前兆数据异常检测方法的流程示意图;
图2为本发明实施例中地球重力观测数据图;
图3为本发明实施例中采用本发明的方法处理得到的地球重力观测日均值数据异常识别结果;
图4为本发明实施例中采用本发明的方法处理得到的地球重力日均值一阶差分数据异常识别结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明所述的一种地震前兆数据异常检测方法,包含以下步骤:
S1、地震前兆数据处理;查询数据库,获取已存储的历史地震前兆数据集,根据指令进行数据预处理,将预处理后的数据集分为训练集、验证集和测试集三个子集;
所述数据预处理为对地震前兆数据进行zero-mean标准化处理,以加快模型训练的收敛速度。
所述训练集由正常变化数据组成;所述验证集由随机选取的5%的训练集数据组成,用于检验模型训练过程中的收敛情况,同时防止模型过拟合;所述测试集由正常变化数据和异常变化数据组成,用于检验模型的泛化能力。
S2、构建LSTM-RNN预测模型;所述预测模型分为输入层、隐藏层及输出层;其中,所述训练集作为预测模型的输入;所述隐藏层为多层,相邻之间采用全连接的方式;所述输出层为一个全连接层,其神经元的个数与需要向后预测的数据长度一致,采用线性激活方式;在所述预测模型中采用均方误差作为损失函数,以表征LSTM网络模型的预测能力;
在所述隐藏层中,根据数据集的信息量和网络规模,设定dropout参数,随机抑制部分神经元的输出,以避免训练过程中出现过拟合现象,使所有神经元得到更加充分的训练。
所述dropout参数的数值与数据集的信息量负相关,与网络规模正相关。默认状态下设置为0.1。
单步预测能够及时发现数据异常变化,且预测结果较为合理,默认设置向后预测的数据长度为1。
所述损失函数为:
Figure BDA0001834436380000061
其中,yi(t)为t时刻模型输出的预测值,
Figure BDA0001834436380000062
为t时刻实际观测值。
S3、训练预测模型;将所述训练集中的数据作为输入,通过指令运用通过时间的反向传播算法,进行所述预测模型的训练,其中,首先初步设定预测模型超参数的初始值,然后使用贝叶斯优化去寻找超参数的最优解;
所述预测模型超参数包括:隐藏层数、每层神经元数量、dropout、learning rate、epoch、batch_size等。
S4、预测模型参数调整;根据所述损失函数,设定异常触发阈值;用测试集中数据对预测模型进行测试,预测模型根据输入的数据,不断向后预测。通过监控预测误差是否达到异常触发阈值,判定是否存在异常数据,并以预测误差作为异常数据的量化描述;根据对测试集中异常数据的识别率,对所述超参数的值进行调整,直到对测试集中异常数据识别的误差值和所触发的非异常数据的数量都达到期望值时结束;
所述异常触发阈值设定为2倍平均误差。
S5、保存预测模型;用所述验证集的数据,检查训练过程中误差变化情况,当训练集与验证集的误差均达到最小期望值时结束,保存预测模型及损失函数;
S6、利用预测模型进行地震前兆数据预测;输入当前的地震前兆数据至所述预测模型,输出预测值,根据程序指令与异常触发阈值进行比较,判定是否为异常数据。
在此,本发明提供以具体的实施例,来说明采用本发明所提供的方法能够对地震前兆数据进行准确的识别,并进行定量化描述,并能够法现人工检测所没有发现或难以确切描述的。
具体的,如图2上图所示。数据集是某地震监测台自2011年1月1日至2013年12月31日的重力日均值观测数据,共包含1095个数据样本点。日均值数据整体呈现上升趋势,为更好的在趋势变化中提取异常数据,一般采用一阶差分的形式对数据进行处理,去除趋势,提高异常的辨识度。如图2下图所示,人工判定对数据判定的描述为:在地震发生之前,重力观测数据在8月21日趋势上升速率减缓,9月11日趋势转折下降,10月3日下降速率减缓,呈现波动式下降,11月15日恢复正常上升速率,一周后地震发生。在图2中,方框区为人工判定异常的范围。
从重力观测数据集的整个变化过程可以看出,2012年10月之前数据整体变化平稳,数据异常变化主要出现在2012年10月之后,因此将2011年1月至2012年6月之间的数据作为训练数据。
根据训练集数据的特征,初步设定预测模拟超参数的初始值,然后使用贝叶斯优化得到超参数的最优解。隐藏层数为2,每层神经元数量分别为60和10,dropout为0.1,learning rate为0.05,epoch为10,batch_size为3,向后预测步长为1。
随机选择5%的训练集数据作为验证集。
模型在训练集的平均标准差为0.001,因此设定异常数据的触发阈值为0.002。
将测试集数据输入至预测模型,进行异常数据识别。预测模型根据输入的数据,不断向后预测。通过监控预测误差是否达到触发阈值,判定是否存在异常数据,并以预测误差作为异常数据的量化描述。
如图3上图所示,实线为测试集原始观测数据,虚线为由预测模型逐点预测的结果。图3下图为实际观测值与预测值的均方误差,黑色虚线为异常触发阈值。与人工检测结果相同的是,预测模型能够通过误差阈值准确识别出8月21日之后观测数据较为明显的趋势异常变化,当11月15日后数据恢复趋势变化后,误差相应出现逐渐下降趋势。但本发明所提供的方法检测识别出了更多的信息,自2012年12月12日数据出现突降后,误差既出现增高趋势,2013年5月26日数据出现突升时,误差表现出明显的高值突跳,随后基本上都处于异常触发阈值以上,直至数据恢复趋势变化。基于LSTM-RNN的预测模型能够发现人工不易察觉的异常变化,提前检测到异常数据,且对异常可以实现定量化描述。
如图4所示,为一阶差分数据异常识别结果。预测模型同样能够对2013年8月至10月趋势的异常变化准确识别,在误差上表现为较明显的长周期变化。除此之外,从误差曲线可以看出,自2013年1月20日开始高频扰动明显增多,且幅值较之前相比有所增高,这些由预测模型提取的异常变化是人工检测没有发现或难以确切描述的。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种地震前兆数据异常检测方法,其特征在于,所述方法包括:
S1、地震前兆数据处理;查询数据库,获取已存储的历史地震前兆数据集,根据指令进行数据预处理,将预处理后的数据集分为训练集、验证集和测试集三个子集;
S2、构建LSTM-RNN预测模型;所述预测模型分为输入层、隐藏层及输出层;其中,所述训练集作为预测模型的输入;所述隐藏层为多层,相邻之间采用全连接的方式;所述输出层为一个全连接层,其神经元的个数与需要向后预测的数据长度一致,采用线性激活方式;在所述预测模型中采用均方误差作为损失函数;
S3、训练预测模型;将所述训练集中的数据作为输入,通过指令运用通过时间的反向传播算法,进行所述预测模型的训练,其中,首先初步设定预测模型超参数的初始值,然后使用贝叶斯优化去寻找超参数的最优解;
S4、预测模型参数调整;根据所述损失函数,设定异常触发阈值;用测试集中数据对预测模型进行测试,根据对测试集中异常数据的识别率,对所述超参数的值进行调整,直到对测试集中异常数据识别的误差值和所触发的非异常数据的数量都达到期望值时结束;
S5、保存预测模型;用所述验证集的数据,检查训练过程中误差变化情况,当训练集与验证集的误差均达到最小期望值时结束,保存预测模型及损失函数;
S6、利用预测模型进行地震前兆数据预测;输入当前的地震前兆数据至所述预测模型,输出预测值,根据程序指令与异常触发阈值进行比较,判定是否为异常数据;
所述训练集由正常变化数据组成;所述验证集由随机选取的5%的训练集数据组成;所述测试集由正常变化数据和异常变化数据组成;
所述损失函数为:
Figure FDA0003456146980000011
其中,yi(t)为t时刻模型输出的预测值,
Figure FDA0003456146980000012
为t时刻实际观测值;
所述数据预处理为对地震前兆数据进行zero-mean标准化处理。
2.根据权利要求1所述的一种地震前兆数据异常检测方法,其特征在于:在所述隐藏层中,根据数据集的信息量和网络规模,设定dropout参数,随机抑制部分神经元的输出。
3.根据权利要求2所述的一种地震前兆数据异常检测方法,其特征在于:所述dropout参数的数值与数据集的信息量负相关,与网络规模正相关。
4.根据权利要求1所述的一种地震前兆数据异常检测方法,其特征在于:所述预测模型超参数包括:隐藏层数、每层神经元数量、dropout、learning rate、epoch、batch_size。
5.根据权利要求1所述的一种地震前兆数据异常检测方法,其特征在于:所述异常触发阈值设定为2倍平均误差。
CN201811219615.8A 2019-03-21 2019-03-21 一种地震前兆数据异常检测方法 Active CN109738939B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811219615.8A CN109738939B (zh) 2019-03-21 2019-03-21 一种地震前兆数据异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811219615.8A CN109738939B (zh) 2019-03-21 2019-03-21 一种地震前兆数据异常检测方法

Publications (2)

Publication Number Publication Date
CN109738939A CN109738939A (zh) 2019-05-10
CN109738939B true CN109738939B (zh) 2022-06-21

Family

ID=66354337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811219615.8A Active CN109738939B (zh) 2019-03-21 2019-03-21 一种地震前兆数据异常检测方法

Country Status (1)

Country Link
CN (1) CN109738939B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11604934B2 (en) * 2019-05-29 2023-03-14 Nec Corporation Failure prediction using gradient-based sensor identification
CN110458355A (zh) * 2019-08-09 2019-11-15 泰康保险集团股份有限公司 事件预测方法、装置、设备及存储介质
CN111709072B (zh) * 2020-06-01 2022-05-17 哈尔滨工业大学 一种地下地震动幅值参数预测方法
CN112036075A (zh) * 2020-08-11 2020-12-04 中国环境监测总站 一种基于环境监测数据关联关系的异常数据判定方法
CN114114410B (zh) * 2020-08-28 2022-09-09 中国科学技术大学 一种识别异常地震信号的方法
CN112651543A (zh) * 2020-11-10 2021-04-13 沈阳工程学院 一种基于vmd分解与lstm网络的日用电量预测方法
CN112215307B (zh) * 2020-11-19 2024-03-19 薛蕾 一种应用机器学习自动检测地震仪器信号异常的方法
CN113240110B (zh) * 2021-05-19 2023-09-29 深圳市智影医疗科技有限公司 确定模型的方法、设备以及计算机可读存储介质
CN113960661A (zh) * 2021-10-22 2022-01-21 中国科学院空天信息创新研究院 一种基于前兆预警增强因子的混合地震预测模型
CN116068479A (zh) * 2023-03-07 2023-05-05 潍柴动力股份有限公司 燃料电池耐久试验中输出性能信号的异常检测方法与装置
CN116361728B (zh) * 2023-03-14 2024-01-23 南京航空航天大学 基于实时飞行数据的民航飞机系统级异常前兆识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699317A (zh) * 2009-11-09 2010-04-28 东南大学 利用地震参量进行短期地震预测的神经网络方法
WO2014002977A1 (ja) * 2012-06-25 2014-01-03 国立大学法人名古屋大学 空気と水と土骨格の連成計算装置および連成計算方法並びに連成計算プログラム
CN106646587A (zh) * 2016-12-29 2017-05-10 北京知觉科技有限公司 基于声振动信号的目标检测与识别方法及系统
AU2017101011A4 (en) * 2017-07-26 2017-08-31 Institute Of Crustal Dynamics, China Earthquake Administration An earthquake precursor strain gauge
CN108805269A (zh) * 2018-06-28 2018-11-13 杭州叙简科技股份有限公司 一种基于lstm循环神经网络拾取震相到时的方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053279A (zh) * 2010-10-21 2011-05-11 叶晓煌 一种电磁扰动仪的电源干扰识别方法
CN104570093A (zh) * 2014-12-26 2015-04-29 深圳市微纳集成电路与系统应用研究院 地震前兆信号处理系统及方法
CN105975504A (zh) * 2016-04-28 2016-09-28 中国科学院计算技术研究所 一种基于循环神经网络的社交网络消息爆发检测方法及系统
CN106407889B (zh) * 2016-08-26 2020-08-04 上海交通大学 基于光流图深度学习模型在视频中人体交互动作识别方法
US20180144815A1 (en) * 2016-11-23 2018-05-24 Sas Institute Inc. Computer system to identify anomalies based on computer generated results
CN106599520B (zh) * 2016-12-31 2018-08-03 中国科学技术大学 一种基于lstm-rnn模型的空气污染物浓度预报方法
CN106918836B (zh) * 2017-03-31 2018-02-13 吉林大学 基于主成分分析的钻孔应变数据异常提取方法
CN107730087A (zh) * 2017-09-20 2018-02-23 平安科技(深圳)有限公司 预测模型训练方法、数据监控方法、装置、设备及介质
CN107563574A (zh) * 2017-09-29 2018-01-09 北京理工大学 一种基于长短时记忆模型循环神经网络的地磁场预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699317A (zh) * 2009-11-09 2010-04-28 东南大学 利用地震参量进行短期地震预测的神经网络方法
WO2014002977A1 (ja) * 2012-06-25 2014-01-03 国立大学法人名古屋大学 空気と水と土骨格の連成計算装置および連成計算方法並びに連成計算プログラム
CN106646587A (zh) * 2016-12-29 2017-05-10 北京知觉科技有限公司 基于声振动信号的目标检测与识别方法及系统
AU2017101011A4 (en) * 2017-07-26 2017-08-31 Institute Of Crustal Dynamics, China Earthquake Administration An earthquake precursor strain gauge
CN108805269A (zh) * 2018-06-28 2018-11-13 杭州叙简科技股份有限公司 一种基于lstm循环神经网络拾取震相到时的方法

Also Published As

Publication number Publication date
CN109738939A (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN109738939B (zh) 一种地震前兆数据异常检测方法
CN108460144B (zh) 一种基于机器学习的煤炭设备故障预警系统及方法
CN113887616B (zh) 一种epg连接数的实时异常检测方法
CN116757534B (zh) 一种基于神经训练网络的智能冰箱可靠性分析方法
CN111353482A (zh) 一种基于lstm的疲劳因子隐性异常检测及故障诊断方法
CN111507376A (zh) 一种基于多种无监督方法融合的单指标异常检测方法
CN113657221B (zh) 一种基于智能感知技术的电厂设备状态监测方法
US11640328B2 (en) Predicting equipment fail mode from process trace
CN107436277A (zh) 基于相似距离判别的单指标数据质量控制方法
CN111861211A (zh) 一种具有双层反窃电模型的系统
CN110110740A (zh) 基于多时间尺度特征和神经网络的钻进过程工况识别方法
CN111179591A (zh) 一种路网交通时序特征数据质量诊断与修复方法
CN118051827A (zh) 基于深度学习的电网故障预测方法
Son et al. Deep learning-based anomaly detection to classify inaccurate data and damaged condition of a cable-stayed bridge
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN118114186B (zh) 一种基于人工智能的设备振动故障诊断方法
CN115470850A (zh) 一种基于管网水质时空数据的水质异常事件识别预警方法
CN117708669A (zh) 一种基于多源数据的自适应概率神经网络高压电缆状态评估方法
CN114581699A (zh) 考虑多源信息时基于深度学习模型的变压器状态评估方法
CN118249504A (zh) 微网设备状态智能诊断与告警通知系统
CN116034321A (zh) 解释工业应用中的机器学习输出
CN118014115A (zh) 一种基于长短时记忆网络的产线损耗监测方法
CN117452062A (zh) 一种考虑运行负荷的台区线损率监测方法
CN116662899A (zh) 一种基于自适应策略的含噪数据异常检测方法
Cannarile et al. A novel method for sensor data validation based on the analysis of wavelet transform scalograms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant