发明内容
本发明所要解决的技术问题是提供一种能够减少传输量和占用存储空间的被动地震监测数据压缩方法及控制系统。
本发明的技术方案是:一种被动地震监测数据压缩方法,其特别之处在于:通过以下步骤实现:
(1)、地震事件的识别:当地震信号在地震事件发生前后的能量出现比较明显的区别时,根据短时间窗内地震信号的振幅特征平均值与长时间窗内地震信号的振幅特征平均值的比值R来识别地震事件,当该比值R大于一个设定的阀值T,并且连续大于该阀值T的R值的数量GW大于临界窗口TW时,则判定地震事件发生;
(2)、地震事件的截取:对已经识别的地震事件进行截取,将有效地震事件信号从地震原始信号中分离出来;
(3)、地震监测数据的压缩:采用steim-2编码实现地震监测数据的无损压缩。
所述步骤(1)的地震事件识别的具体步骤为:
A.初始化,T为阈值,T初始化为4,TW为临界窗口大小,TW初始化为30, iF为事件中第一个大于阈值T的点的索引,iF初始化为-1,GW为R值连续大于阈值T的数量,GW初始化为0,i为R值序列索引,i初始化为0,TK为原始数据采样点数;
B.从开始连续计算原始数据中短时间窗内地震信号的振幅特征平均值与长时间窗内地震信号的振幅特征平均值的比值,并保存于数组R中;
C. 在R值序列中判断第i个R值是否大于阈值T,如果大于阈值T,则转到D步骤,否则令GW=0,iF=-1,i加1,转到G步骤;
D. GW加1,i加1,如果iF等于-1,则令iF=i,转到E步骤;
E.如果GW大于TW,则地震事件发生,转到F步骤,否则,转到C步骤;
F.调用事件截取函数,该函数返回值为iGA,令i=iGA,令GW=0,iF=-1,转到G步骤;
G.如果i>=TK则算法结束,否则转到C步骤。
所述步骤(1)的地震事件识别的具体步骤的计算过程为:
A、计算短时间窗内地震信号的振幅特征平均值:从地震数据采集设备中连续读取
个地震原始信号的振幅值
,按照式(1)计算
,
其中,
是地震信号的振幅特征值,由公式(2)计算得到,
为短时间窗内所包含的记录个数,
式(2)中
为地震原始信号的振幅值,
是振幅和其一阶导数的加权因子,由式(3)计算得到;
B、计算长时间窗内地震信号的振幅特征平均值:从地震数据采集设备中在短时间窗后连续读取
个地震原始信号的振幅值
,按照式(4)计算
,
其中,
是地震信号的振幅特征值,由公式(5)计算得到,
为长时间窗内所包含的记录个数,
式(5)中
为地震原始信号的振幅值,
是加权因子,由式(6)计算得到;
C、计算短时间窗振幅特征平均值与长时间窗振幅特征平均值的比值
,按照式(7)计算
,
D、地震事件识别:根据地震数据采集设备中的设置值,从地震数据采集设备中读取10000个以上点的原始数据,连续计算这些点的R值,接着计算R值的平均值RV,然后在R值序列中,从起始位置依次逐一判断,如果R值连续超过预先设定阈值的点数GW超过临界窗口TW,则认为该段信号为地震事件,在判断事件的过程中要记录事件的第一个R值大于阈值点的位置为iF。
所述步骤(2)的地震事件截取的具体步骤为:
A、检索事件的起始点:在R值序列中,从步骤(1)中所得到的iF位置向前检索,逐一判断直到找到第一个R值小于在步骤(1)中计算得到RV的点,记录该点的位置为g,然后从g位置开始向前检索直到找到第一个拐点,记录该拐点的位置为k,该拐点的特征分为两种情况,一种是R值序列中,在位置k后的R值从大到小逐渐变小,在位置k前的R值从小到大逐渐变大,另一种是R值序列中,在位置k后R值从大到小逐渐变小后保持不变,根据地震数据采集设备中的设置值,从位置k再往前移动30个点,记录该点的位置为iGB,把R值中iGB处对应的地震原始信号处的点作为该事件的起始点;
B、检索事件的终止点:在R值序列中,从步骤(1)中所得到的iF位置向后检索,逐一判断直到找到第一个R值小于在步骤(1)中计算得到的RV的点,记录该点位置为j,然后根据地震数据采集设备中的设置值,从位置j再往后移动10个点,记录该点的位置为iGA,把R值中iGA处对应的地震原始信号处的点作为该事件的终止点。
C、事件的截取:把原始地震信号序列中从iGB位置到iGA位置的信号截取出来即为地震事件信号,同时要把事件的起始点即iGB点的真实时间也记录下来。
所述步骤(2)的地震事件截取具体步骤的计算过程为:
A.从位置iF开始在R值序列中向前逐一判断R值,直到找到第一个小于RV的点,记录该点位置g;
B.从位置g开始向前在R值序列中找到第一个拐点,记录该点的位置为k,赋值iGB=k+30;
C.从位置iF开始在R值序列中向后逐一判断R值,直到找到第一个小于RV的点,记录该点位置j;
D.赋值iGA=j+10;
E.截取原始信号序列中从iGB到iGA位置的信号为该事件的信号。
所述的被动地震监测数据压缩方法的控制系统为:该控制系统包括中央控制单元、时钟同步模块、信号采集模块、数据存储模块、网络通信模块和电源控制模块,时钟同步模块、信号采集模块和网络通信模块分别与中央控制单元连接,所述中央控制单元上连接有数据存储模块,所述电源控制模块连接到中央控制单元上,所述时钟同步模块与GPS授时模块连接,信号采集模块与检波器连接,网络通信模块与网络设备连接。
与现有技术相比,本发明的有益效果为:
1.该方法能够自动、快速、实时、有效去除冗余数据,然后再进行无损压缩的方法以及装置,通过对被动地震事件的自动识别和提取,去除冗余数据,然后再进行数据的无损压缩,有效地减少了数据的传输量和占用存储空间,为被动地震监测数据的无线长距离实时传输提供了可能;
2.该控制系统能够在地面或井下对地震进行长期连续监测,该控制系统集数据采集、数/模转换、数据存储、地震事件识别、数据压缩和数据传输为一体,能够根据监测数据的实际情况,例如:背景噪声大小、地震信号强弱、信噪比高低等来设置事件识别算法中的时窗长度、事件识别阈值等参数,传输前的预处理已经将冗余数据去除,数据中仅仅保留有效的地震事件,然后再对这些数据进行无损压缩,进一步减少了数据量,因此传输的数据量很少,能够提高监测中心的处理速度,从而提高整个监测系统响应的实时性,而且占用磁盘空间很小。
具体实施方式
被动地震监测数据压缩方法,包括以下步骤:
步骤一、地震事件的识别:参见图3,在一定信噪比条件下,地震记录在地震事件发生前后的能量,即地震记录中的振幅会出现比较明显的区别,当事件到达时,短时间窗口内地震信号的振幅平均值比长时间窗口内地震信号的振幅平均值变化要快,相应的二者的比值R的增加会更加明显,当其比值R大于一个设定的阈值T,即控制系统设定的阀值,并且连续大于该阈值T的R值的数量GW大于临界窗口TW时,则判定地震事件发生;当在事件到达时能量变化却不明显时,直接用原始信号的振幅进行计算可能就会漏掉该事件,因此引入一个新的时间序列
来反应原始信号的变化特征,即特征函数,由下述公式(2)表示,
参见图8,步骤一的地震事件识别的详细步骤为:
A.初始化,T为阈值,设T初始化为4,该值的设定方法是在正式监测前,在未进行地震事件的识别前,先采用1、2台设备采集监测区的地震数据作为样本,然后计算样本数据中短时窗内地震信号的振幅特征平均值与长时窗内地震信号的振幅特征平均值的比值R,人工判断地震数据在低信噪比时的10个以上的地震事件,接着在其中一个事件对应的R值序列中检索,即从事件开始到事件结束的整个时间段对应的R值,直到检索到一个最大临界值T1,使得在该事件对应的R值序列中存在一个连续大于T1的点数GW超过TW的区间为止,然后采用同样的方法找到每个事件的临界值,最后求这些事件临界值的平均值,记为T,T即为阈值,iF为事件中第一个大于阈值T的点的索引,iF初始化为-1,TW为临界窗口大小,TW初始化为30,该值的设定方法是在正式监测前,在未进行地震事件的识别前,先采用1、2台设备采集监测区的地震数据作为样本,然后人工判断地震数据中的地震事件,然后找到10个以上的持续时间较短的地震事件,记录这些地震事件的平均持续时间为TT,TW赋值为TT的2/3,TW即为临界窗口,GW为R值连续大于阈值T的数量,GW初始化为0,i为R值序列索引,i初始化为0,TK为原始数据采样点数;
B.从开始连续计算原始数据中短时间窗内地震信号的振幅特征平均值与长时间窗内地震信号的振幅特征平均值的比值,并保存于数组R中;
C. 在R值序列中逐一判断第i个R值是否大于阈值T,如果大于阈值T,则转到D步骤,否则令GW=0,iF=-1,i加1,转到G步骤;
D. GW加1,i加1,如果iF等于-1,则令iF=i,转到E步骤;
E.如果GW大于TW,则地震事件发生,转到F步骤,否则,转到C步骤;
F.调用事件截取函数,该函数返回值为iGA,令i=iGA,令GW=0,iF=-1,转到G步骤;
G.如果i>=TK则算法结束,否则转到C步骤。
步骤一的具体计算过程如下:
a. 计算短时间窗内地震信号的振幅特征平均值:从地震数据采集设备中连续读取
个地震原始信号的振幅值
,为了计算方便,采用递归方式进行计算,按照式(1)计算
,
根据长短时窗之间关系的不同,可把
和
的计算方法分为标准和延迟:
图4为标准方法示意图,标准方法就是
开始于
之后一点,中间没有时间重叠和延迟;
图5为延迟方法示意图,延迟方法就是
和
窗口之间有一段时间间隔,
和
计算式和标准方法基本类似。
递归方法是在标准方法基础上发展来的,避免了监测数据长久占用内存,递归方法对于微地震事件能够产生一个指数衰减脉冲响应,而且在事件结束后能够很快恢复。
采用递归方式计算R的推导过程为:图6为对上述三种计算
和
的比较,图6(b)对于噪声的抑制效果较好,曲线比较光滑,能够准确识别事件,有利于事件信号的截取。
在式(1)中,
是地震信号的振幅特征值,由公式(2)计算得到,
为短时间窗内所包含的记录个数,
(2)
式(2)中
为地震原始信号的振幅值,
是振幅和其一阶导数的加权因子,由式(3)计算得到,式(2)即为地震信号的特征函数,其中的
为地震事件到来前后地震记录的能量之差的平方,
为i点的振幅与i点和前一点振幅之差的商,
乘以
能够进一步放大地震事件到来前后地震记录的能量之差,因此式(2)能够更好的反应地震事件到来前后地震记录的能量之差,能够更加便于识别地震事件。
采用式(2)作为特征函数的推导过程为:能够表征这种信号突变的特征函数的主要还有以下4种:
(5)
图7为采用上述5种特征函数对同一个事件进行识别的比较,为了便于比较,对原始信号和R值曲线都进行归一化处理,从图7中不难发现图7(a)中采用式(2)的特征函数计算得到的R值曲线很好的和地震事件的包络吻合,而且具有很高的信噪比,在有事件发生时该曲线能够迅速升高,便于识别事件,在事件结束时该曲线迅速下降,表示事件结束,因此本方法采用式(2)作为特征函数;
b. 计算长时间窗内地震信号的振幅特征平均值:从地震数据采集设备中在短时间窗后连续读取
个地震原始信号的振幅值
,为了计算方便,采用递归方式进行计算,按照式(8)计算
,
(8)
其中,
是地震信号的振幅特征值,由公式(9)计算得到,
为长时间窗内所包含的记录个数,
式(9)中
为地震原始信号的振幅值,
是加权因子,由式(10)计算得到,式(9)与式(2)一样都是地震信号的特征函数,其推导原理与式(2)相同;
c. 计算短时间窗振幅特征平均值与长时间窗振幅特征平均值的比值
:按照式(11)计算
,
(11);
d.参见图8地震事件的识别:计算连续10000(根据地震数据采集系统设置值确定)个以上点的R值序列的平均值RV,然后在R值序列中,从起始位置开始逐一判断,如果R值连续超过预先设定阈值T的点数GW超过临界窗口值TW,则认为该段信号为地震事件,记录事件中第一个R值大于阈值点的位置为iF。
步骤二:地震事件的截取:对已经识别的地震事件进行截取,从而将有效地震事件信号从地震原始信号中分离出来,该过程要注意保持地震事件的完整性,即保留事件的初至、发展、结束信号,但是又要尽量去除冗余的信号,请参照图10所示,详细步骤如下:
A.检索事件的起始点:如图9所示,在R值序列中,从步骤一中得到的iF位置向前检索,逐一判断直到找到第一个R值小于在步骤一中计算得到RV的点,记录该点的位置为g,然后从g位置开始向前检索直到找到第一个拐点,记录该点的位置为k,该拐点的特征可以为两种情况,一种是R值序列中,在位置k后的R值从大到小逐渐变小,在位置k前的R值从小到大逐渐变大,另一种是R值序列中,在位置k后R值从大到小逐渐变小后保持不变,如图9(c)中的箭头二,然后从位置k再往前移动30(根据地震数据采集系统设置值确定)个点,记录该点的位置为iGB,如图9(c)中的箭头一,把R值中iGB处对应的地震原始信号处的点作为该事件的起始点;
B.检索事件的终止点:在R值序列中,从步骤一中计算得到的iF位置向后检索,逐一判断直到找到第一个R值小于RV的点,如图9(c)箭头三所示,RV为在步骤一中计算得到的点,记录该点位置为j,然后再往后移动10(根据地震数据采集系统设置值确定)个点,记录该点的位置为iGA,把R值中iGA处对应的地震原始信号处的点作为该事件的终止点;
C.事件的截取:把原始地震信号序列中从iGB位置到iGA位置的信号截取出来即位地震事件信号,注意同时要把事件的起始点iGB点的真实时间也记录下来,图9(b)即为截取后的地震事件信号。
步骤三:地震事件数据的压缩:由于地震事件的信号本身比较弱,为了不影响地震事件定位的精度和其他分析,本发明采用Steim-2压缩算法对地震事件数据进行无损压缩,该方法的最大理论压缩比能够达到6.07:1,该压缩方法是存储用较少位数就能表示的前后数据的差而不是数据本身,因为在正常地震背景情况下,地震数据采集系统输出数据在时间上具有很强的关联性,也就是说在确定某些样本的情况下,其它样本是可以通过这些样本来预测,而且对地震事件记录而言,连续数据样本之间的差值与满量程的32比特数字值相比都很小,尽管在重大地震活动中连续两样本的差会大于单字节所能表示的最大值,但发生这种情况的概率很小,一般小于总时间的1%。
该方法只关心相邻的两个数据样本的差,并不关心其它数据样本,这与监测数据的特点相吻合,地震事件数据一旦提取出来就能够迅速进行压缩,能够满足实时传输的要求,由于通过地震事件识别去除冗余数据后,地震信号已经不连续了,因此需要记录地震事件的起始时间,在压缩前的地震事件数据前连续插入两次事件的起始时间,以避免与地震数据混淆,然后把一个个的地震事件数据连接起来进行压缩,压缩成Steim-2帧。
如图1所示,实现被动地震监测数据压缩方法的控制系统包括中央控制单元、时钟同步模块、信号采集模块、数据存储模块、网络通信模块和电源控制模块,时钟同步模块、信号采集模块和网络通信模块分别与中央控制单元连接,所述中央控制单元上连接有数据存储模块,所述电源控制模块连接到中央控制单元上,所述时钟同步模块与GPS授时模块连接,信号采集模块与检波器连接,网络通信模块与网络设备连接。
该控制系统的工作过程为:如图2所示,首先通过网络通信模块对控制系统的工作模式、采样率、地震数据采集时间等参数进行设置,然后采用GPS授时模块通过时钟控制模块对控制系统进行授时;接着控制系统内部时钟控制模块的内部时钟启动,控制系统进入等待模式,当达到采集时间时,控制系统进入采集模式,通过信号采集模块开始采集检波器传来的数据,并且进行数模转换,同时启动数据压缩和数据传输程序;然后数据压缩程序首先从采集的数据中识别地震事件并且提取地震事件数据,再对地震事件数据进行压缩,数据传输程序对压缩后的数据通过网络通信模块经由有线或者无线网络传输到监控中心;最后到达采集结束时间后,控制系统停止数据采集,进入等待模式,同时数据压缩和数据传输程序在处理完所有的采集数据后自动退出。
在实际操作中,将一个台站长度为一小时的数据进行处理,共检测出1618个事件,原始数据为109.80Mb,经过事件截取后数据大小变为19.76Mb,减少冗余数据90.04Mb,将数据量减少为原始数据的82%,数据的压缩比为5:1。再对19.76Mb的数据进行无损压缩,压缩后的数据量为4.82Mb,压缩比为4:1,最后的数据量为原始数据的4.4%,压缩比为20:1。这将大大减少数据的传输量,为数据的无线传输创造了条件,同时也大大减少数据占用的磁盘资源。