CN110837112A - 一种用于地震道编辑的数据预处理方法及系统 - Google Patents

一种用于地震道编辑的数据预处理方法及系统 Download PDF

Info

Publication number
CN110837112A
CN110837112A CN201810932285.0A CN201810932285A CN110837112A CN 110837112 A CN110837112 A CN 110837112A CN 201810932285 A CN201810932285 A CN 201810932285A CN 110837112 A CN110837112 A CN 110837112A
Authority
CN
China
Prior art keywords
data
seismic
normalization
unit
rot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810932285.0A
Other languages
English (en)
Inventor
朱海伟
陈金焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Sinopec Geophysical Research Institute
Original Assignee
China Petroleum and Chemical Corp
Sinopec Geophysical Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Sinopec Geophysical Research Institute filed Critical China Petroleum and Chemical Corp
Priority to CN201810932285.0A priority Critical patent/CN110837112A/zh
Publication of CN110837112A publication Critical patent/CN110837112A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. analysis, for interpretation, for correction

Landscapes

  • Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Environmental & Geological Engineering (AREA)
  • Geology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Geophysics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明提供一种用于地震道编辑的数据预处理方法及系统,该方法包括:S1、将地震数据进行异常值剔除;S2、将异常值剔除后的地震数据进行数据归一化;S3、将数据归一化后的地震数据进行ZCA白化。该系统包括:异常值剔除单元,用于将地震数据进行异常值剔除;归一化单元,与所述异常值剔除单元相连,用于将异常值剔除后的地震数据进行数据归一化;ZCA白化单元,与所述归一化单元相连,用于将数据归一化后的地震数据进行ZCA白化。本发明原理简单,实现方便,计算速度快,能有效提高地震数据道编辑的准确率,经过资料测试验证,可以显著有效提高地震道编辑的效果,也有效地验证了方法的可靠性。

Description

一种用于地震道编辑的数据预处理方法及系统
技术领域
本发明涉及石油地震勘探数据处理技术领域,尤其涉及一种用于地震道编辑的数据预处理方法及系统。
背景技术
数据预处理在众多算法中都起着重要作用,现有的机器学习算法可以应用在地震道编辑算法中,但前提是需要对数据进行预处理。现有的常规数据预处理中的算法过于简单粗暴,对地震数据预处理的效果并不十分好。且上述预处理的方法并没有针对地震道编辑有一个较为常用的使用流程,方便地震数据处理人员进行数据处理。
因此,如何对地震数据进行处理,针对地震道编辑一个较为常用的使用流程便地震数据处理人员进行数据处理是本领域亟待解决的问题。
发明内容
本发明的特征和优点在下文的描述中部分地陈述,或者可从该描述显而易见,或者可通过实践本发明而学习。
为克服现有技术的问题,本发明提供一种用于地震道编辑的数据预处理方法,包括步骤:
S1、将地震数据进行异常值剔除;
S2、将异常值剔除后的地震数据进行数据归一化;
S3、将数据归一化后的地震数据进行ZCA白化。
可选地,所述步骤S1包括:
对n维的数据集合计算每个维度的均值和方差μj,σj,j∈{1,...n};
对新的数据
Figure BDA0001766917870000022
计算概率值若所述概率值小于预设阈值,则判定新的数据
Figure BDA0001766917870000024
属于异常值,其中:
可选地,所述步骤S2中采用特征标准化来对地震数据进行归一化。
可选地,所述步骤S3包括:
S31、计算数据集的协方差矩阵∑;
S32、对所述协方差矩阵∑进行SVD分解,得到U向量UTx,并利用UTx,得到数据集经过旋转后的结果xrot
S33、将xrot中的每一维都除以
Figure BDA0001766917870000026
得到xPCAwhite,i,其中是xrot协方差矩阵对角元素的值;
S34、将xPCAwhite,i左乘一个特征向量矩阵U,得到ZCA白化。
可选地,在所述步骤S3中保留数据的维度不变。
本发明还提供一种用于地震道编辑的数据预处理系统,包括:
异常值剔除单元,用于将地震数据进行异常值剔除;
归一化单元,与所述异常值剔除单元相连,用于将异常值剔除后的地震数据进行数据归一化;
ZCA白化单元,与所述归一化单元相连,用于将数据归一化后的地震数据进行ZCA白化。
可选地,所述异常值剔除单元用于:
对n维的数据集合计算每个维度的均值和方差μj,σj,j∈{1,...n};
对新的数据
Figure BDA0001766917870000031
计算概率值
Figure BDA0001766917870000032
若所述概率值小于预设阈值,则判定新的数据
Figure BDA0001766917870000033
属于异常值,其中:
Figure BDA0001766917870000034
可选地,所述归一化单元用于采用特征标准化来对地震数据进行归一化。
可选地,所述ZCA白化单元用于:
计算数据集的协方差矩阵∑;
对所述协方差矩阵∑进行SVD分解,得到U向量UTx,并利用UTx,得到数据集经过旋转后的结果xrot
将xrot中的每一维都除以
Figure BDA0001766917870000035
得到xPCAwhite,i,其中是xrot协方差矩阵对角元素的值;
将xPCAwhite,i左乘一个特征向量矩阵U,得到ZCA白化。
本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行的至少一个程序,其特征在于,所述至少一个程序被所述计算机执行时使所述计算机执行本发明任一实施例提供的用于地震道编辑的数据预处理方法中的步骤。
本发明提供了一种用于地震道编辑的数据预处理方法及其系统,为用于地震道编辑属性提取之后数据预处理提供一种较为常用的处理流程,为处理解释人员提供方便。
通过阅读说明书,本领域普通技术人员将更好地了解这些技术方案的特征和内容。
附图说明
下面通过参考附图并结合实例具体地描述本发明,本发明的优点和实现方式将会更加明显,其中附图所示内容仅用于对本发明的解释说明,而不构成对本发明的任何意义上的限制,在附图中:
图1为本发明实施例的数据预处理方法的流程示意图。
图2为本发明实施例的数据预处理系统的结构示意图。
图3为未进行数据预处理得到的地震道编辑结果的示意图。
图4为进行数据预处理后得到的地震道编辑结果的示意图。
图5为未进行数据预处理得到的地震道编辑结果的示意图。
图6为进行数据预处理后得到的地震道编辑结果的示意图。
具体实施方式
如图1所示,本发明提供一种用于地震道编辑的数据预处理方法,包括步骤:
S1、将地震数据进行异常值剔除。
异常值是找出其数值不同于预期对象的检测过程。这些对象被称为异常点或者离群点。进行异常点检测的方法有很多,本发明采用基于统计学的方法。假设n维的数据集合形如
Figure BDA0001766917870000041
那么可以计算每个维度的均值和方差μj,σj,j∈{1,...n},具体来说,对于j∈{1,...n},可以计算
Figure BDA0001766917870000042
Figure BDA0001766917870000043
在正态分布的假设下,如果有一个新的数据
Figure BDA0001766917870000044
可以计算概率如下:
Figure BDA0001766917870000051
根据概率值的大小就可以判断x是否属于异常值;若所述概率值小于预设阈值,一般地,预设阈值为3%~8%;例如是3%、5%。则判定新的数据
Figure BDA0001766917870000052
属于异常值。
S2、将异常值剔除后的地震数据进行数据归一化。
数据归一化常用的方法可以采取例如简单缩放、逐样本均值消减、特征标准化等。本实施例中选用特征标准化来对地震数据进行归一化。特征标准化指的是(独立地)使得数据的每一个维度具有零均值和单位方差。这是归一化中最常见的方法并被广泛地使用。应用到本实施例中,特征标准化的具体做法是:首先计算每一个地震属性上数据的均值(使用全体数据计算),之后在每一个地震属性上都减去该均值,下一步便是在数据的每一地震属性上除以该地震属性数据的标准差。
S3、将数据归一化后的地震数据进行ZCA白化。
ZCA白化的主要用于去相关性,尽量使白化后的数据接近原始输入数据。对于含有m个样本的数据集{x(1),x(2),...x(m)},假设每个样本的维度为n,即
Figure BDA0001766917870000054
对其进行ZCA白化的具体步骤如下:
S31、计算数据集的协方差矩阵∑,计算公式如下:
Figure BDA0001766917870000053
S32、对所述协方差矩阵∑进行SVD分解,得到U向量UTx,并利用UTx,得到数据集经过旋转后的结果xrot,即:
Figure BDA0001766917870000061
S33、将xrot中的每一维都除以
Figure BDA0001766917870000062
得到xPCAwhite,i,使输入特征具有单位方差,其中
Figure BDA0001766917870000063
是xrot协方差矩阵对角元素的值,计算公式如下:
Figure BDA0001766917870000064
S34、将xPCAwhite,i左乘一个特征向量矩阵U,得到我们需要的ZCA白化,其计算公式如下:
xZCAwhite=UxPCAwhite (7)
需要注意的是,在使用ZCA白化这个过程中即步骤S3中,需要保留数据的全部n个维度,即维持数据的维度不变,不对数据进行降维。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行的至少一个程序,所述至少一个程序被所述计算机执行时使所述计算机执行本发明任一实施例提供的用于地震道编辑的数据预处理方法中的步骤。
如图2所示,本发明提供一种用于地震道编辑的数据预处理系统,包括异常值剔除单元10、归一化单元20以及ZCA白化单元30。其中:
异常值剔除单元10用于将地震数据进行异常值剔除。更具体地,假设n维的数据集合形如
Figure BDA0001766917870000065
那么可以计算每个维度的均值和方差μj,σj,j∈{1,...n},具体来说,对于j∈{1,...n},可以计算
Figure BDA0001766917870000066
在正态分布的假设下,如果有一个新的数据
Figure BDA0001766917870000072
可以计算概率
Figure BDA0001766917870000073
如下:
Figure BDA0001766917870000074
根据概率值的大小就可以判断x是否属于异常值;若所述概率值小于预设阈值,一般地,预设阈值为3%~8%;例如是3%、5%。则判定新的数据
Figure BDA0001766917870000075
属于异常值。
归一化单元20与所述异常值剔除单元10相连,用于将异常值剔除后的地震数据进行数据归一化。本实施例中,采用特征标准化来对地震数据进行归一化。特征标准化的具体做法是:首先计算每一个地震属性上数据的均值(使用全体数据计算),之后在每一个地震属性上都减去该均值,下一步便是在数据的每一地震属性上除以该地震属性数据的标准差。
ZCA白化单元30与所述归一化单元20相连,用于将数据归一化后的地震数据进行ZCA白化。
更具体地,所述ZCA白化单元用于:计算数据集的协方差矩阵∑;对所述协方差矩阵∑进行SVD分解,得到U向量UTx,并利用UTx,得到数据集经过旋转后的结果xrot;将xrot中的每一维都除以
Figure BDA0001766917870000076
得到xPCAwhite,i,其中是xrot协方差矩阵对角元素的值;将xPCAwhite,i左乘一个特征向量矩阵U,得到ZCA白化。其采用的具体公式与上述步骤S31至S34一致,在此不再赘述。
下面辅以实际地震道编辑实例进一步说明,首先对地震数据进行预处理,再进行道编辑计算。第一组数据在未进行数据预处理时得到的地震道编辑结果如图3所示;采用本发明提供的用于地震道编辑的数据预处理方法、系统或计算机可读存储介质对第一组数据进行数据预处理后得到的地震道编辑结果如图4所示。第二组数据在未进行数据预处理时得到的地震道编辑结果如图5所示;采用本发明提供的用于地震道编辑的数据预处理方法、系统或计算机可读存储介质对第二组数据进行数据预处理后得到的地震道编辑结果如图6所示可见,本发明能有效提高结果精度。
本发明提供的用于地震道编辑的数据预处理方法及其系统、计算机可读存储介质,先通过地震数据异常值剔除,再对地震数据进行特征标准化,最后对数据进行ZCA白化。本发明原理简单,实现方便,计算速度快,能有效提高地震数据道编辑的准确率,经过资料测试验证,可以显著有效提高地震道编辑的效果,也有效地验证了方法的可靠性。
以上参照附图说明了本发明的优选实施例,本领域技术人员不脱离本发明的范围和实质,可以有多种变型方案实现本发明。举例而言,作为一个实施例的部分示出或描述的特征可用于另一实施例以得到又一实施例。以上仅为本发明较佳可行的实施例而已,并非因此局限本发明的权利范围,凡运用本发明说明书及附图内容所作的等效变化,均包含于本发明的权利范围之内。

Claims (10)

1.一种用于地震道编辑的数据预处理方法,其特征在于,包括步骤:
S1、将地震数据进行异常值剔除;
S2、将异常值剔除后的地震数据进行数据归一化;
S3、将数据归一化后的地震数据进行ZCA白化。
2.根据权利要求1所述用于地震道编辑的数据预处理方法,其特征在于,所述步骤S1包括:
对n维的数据集合
Figure FDA0001766917860000011
i∈{1,...m},计算每个维度的均值和方差μj,σj,j∈{1,...n};
对新的数据
Figure FDA0001766917860000012
计算概率值
Figure FDA0001766917860000013
若所述概率值小于预设阈值,则判定新的数据
Figure FDA0001766917860000014
属于异常值,其中:
Figure FDA0001766917860000015
3.根据权利要求1所述用于地震道编辑的数据预处理方法,其特征在于,所述步骤S2中采用特征标准化来对地震数据进行归一化。
4.根据权利要求1所述用于地震道编辑的数据预处理方法,其特征在于,所述步骤S3包括:
S31、计算数据集的协方差矩阵∑;
S32、对所述协方差矩阵∑进行SVD分解,得到U向量UTx,并利用UTx,得到数据集经过旋转后的结果xrot
S33、将xrot中的每一维都除以
Figure FDA0001766917860000016
得到xPCAwhite,i,其中
Figure FDA0001766917860000017
是xrot协方差矩阵对角元素的值;
S34、将xPCAwhite,i左乘一个特征向量矩阵U,得到ZCA白化。
5.根据权利要求1所述用于地震道编辑的数据预处理方法,其特征在于,在所述步骤S3中保留数据的维度不变。
6.一种用于地震道编辑的数据预处理系统,其特征在于,包括:
异常值剔除单元,用于将地震数据进行异常值剔除;
归一化单元,与所述异常值剔除单元相连,用于将异常值剔除后的地震数据进行数据归一化;
ZCA白化单元,与所述归一化单元相连,用于将数据归一化后的地震数据进行ZCA白化。
7.根据权利要求6所述用于地震道编辑的数据预处理系统,其特征在于,所述异常值剔除单元用于:
对n维的数据集合
Figure FDA0001766917860000021
i∈{1,...m},计算每个维度的均值和方差μj,σj,j∈{1,...n};
对新的数据
Figure FDA0001766917860000022
计算概率值
Figure FDA0001766917860000023
若所述概率值小于预设阈值,则判定新的数据
Figure FDA0001766917860000024
属于异常值,其中:
Figure FDA0001766917860000025
8.根据权利要求6所述用于地震道编辑的数据预处理系统,其特征在于,所述归一化单元用于采用特征标准化来对地震数据进行归一化。
9.根据权利要求6所述用于地震道编辑的数据预处理系统,其特征在于,所述ZCA白化单元用于:
计算数据集的协方差矩阵∑;
对所述协方差矩阵∑进行SVD分解,得到U向量UTx,并利用UTx,得到数据集经过旋转后的结果xrot
将xrot中的每一维都除以
Figure FDA0001766917860000026
得到xPCAwhite,i,其中是xrot协方差矩阵对角元素的值;
将xPCAwhite,i左乘一个特征向量矩阵U,得到ZCA白化。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行的至少一个程序,其特征在于,所述至少一个程序被所述计算机执行时使所述计算机执行上述权利要求1~5任一项所述的方法中的步骤。
CN201810932285.0A 2018-08-16 2018-08-16 一种用于地震道编辑的数据预处理方法及系统 Pending CN110837112A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810932285.0A CN110837112A (zh) 2018-08-16 2018-08-16 一种用于地震道编辑的数据预处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810932285.0A CN110837112A (zh) 2018-08-16 2018-08-16 一种用于地震道编辑的数据预处理方法及系统

Publications (1)

Publication Number Publication Date
CN110837112A true CN110837112A (zh) 2020-02-25

Family

ID=69573216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810932285.0A Pending CN110837112A (zh) 2018-08-16 2018-08-16 一种用于地震道编辑的数据预处理方法及系统

Country Status (1)

Country Link
CN (1) CN110837112A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103987118A (zh) * 2014-05-19 2014-08-13 浙江师范大学 基于接收信号强度信号ZCA白化的接入点k-means聚类方法
US20150170004A1 (en) * 2011-11-21 2015-06-18 Google Inc. Evaluating image similarity
CN108229760A (zh) * 2018-02-08 2018-06-29 北京航空航天大学 面向灾害预测的不等间距时间序列异常趋势分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150170004A1 (en) * 2011-11-21 2015-06-18 Google Inc. Evaluating image similarity
CN103987118A (zh) * 2014-05-19 2014-08-13 浙江师范大学 基于接收信号强度信号ZCA白化的接入点k-means聚类方法
CN108229760A (zh) * 2018-02-08 2018-06-29 北京航空航天大学 面向灾害预测的不等间距时间序列异常趋势分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
上海市地震局: "《地震测报入门》", 31 May 1980, 上海教育出版社 *
吕文彪 等: "利用独立分量分析法去除地震噪声", 《石油地球物理勘探》 *
码迷: "白化(Whitening): PCA 与 ZCA (转)", 《HTTP://WWW.MAMICODE.COM/INFO-DETAIL-2032779.HTML》 *

Similar Documents

Publication Publication Date Title
WO2018121737A1 (zh) 关键点预测、网络训练及图像处理方法和装置、电子设备
US10747637B2 (en) Detecting anomalous sensors
US10133703B2 (en) Anomaly detection method, program, and system
US20150302240A1 (en) Method and device for locating feature points on human face and storage medium
Kejriwal et al. Wald tests for detecting multiple structural changes in persistence
CN109787958B (zh) 网络流量实时检测方法及检测终端、计算机可读存储介质
CN112308872B (zh) 基于多尺度Gabor一阶导数的图像边缘检测方法
CN111898639A (zh) 基于降维的分层时间记忆工业异常检测方法与装置
CN115471503B (zh) 用于数控剖锭机的设备异常检测方法
CN112966222A (zh) 一种时间序列异常数据检测方法及相关设备
US20190147613A1 (en) Estimation of human orientation in images using depth information
US10282595B2 (en) Facial recognition encode analysis
CN112926592B (zh) 一种基于改进Fast算法的商标检索方法及装置
CN109902731B (zh) 一种基于支持向量机的性能故障的检测方法及装置
CN110837112A (zh) 一种用于地震道编辑的数据预处理方法及系统
CN107943916B (zh) 一种基于在线分类的网页异常检测方法
CN111428510B (zh) 一种基于口碑的p2p平台风险分析方法
CN116079498A (zh) 一种刀具异常信号的识别方法
CN115713670A (zh) 基于图预测网络和自动编码器的异常检测方法及系统
CN112085683B (zh) 一种显著性检测中的深度图可信度检测方法
US10839258B2 (en) Computer-readable recording medium, detection method, and detection device
CN112418217A (zh) 用于识别字符的方法、装置、设备和介质
US11080612B2 (en) Detecting anomalous sensors
CN112541502B (zh) 一种图像处理方法、装置及计算机存储介质和电子设备
CN117473242B (zh) 一种时序数据故障检测方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200225

RJ01 Rejection of invention patent application after publication