CN110441819A - 一种基于均值偏移聚类分析的地震初至波自动拾取方法 - Google Patents
一种基于均值偏移聚类分析的地震初至波自动拾取方法 Download PDFInfo
- Publication number
- CN110441819A CN110441819A CN201910721350.XA CN201910721350A CN110441819A CN 110441819 A CN110441819 A CN 110441819A CN 201910721350 A CN201910721350 A CN 201910721350A CN 110441819 A CN110441819 A CN 110441819A
- Authority
- CN
- China
- Prior art keywords
- seismic
- mean shift
- wave
- arrival
- break
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 26
- 230000000694 effects Effects 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 26
- 239000000523 sample Substances 0.000 description 20
- 238000012937 correction Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000003068 static effect Effects 0.000 description 10
- 239000010410 layer Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 241000208340 Araliaceae Species 0.000 description 4
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 235000008434 ginseng Nutrition 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012876 topography Methods 0.000 description 3
- 241000238097 Callinectes sapidus Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003706 image smoothing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000003325 tomography Methods 0.000 description 1
- 238000013107 unsupervised machine learning method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V1/00—Seismology; Seismic or acoustic prospecting or detecting
- G01V1/28—Processing seismic data, e.g. for interpretation or for event detection
- G01V1/30—Analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V1/00—Seismology; Seismic or acoustic prospecting or detecting
- G01V1/28—Processing seismic data, e.g. for interpretation or for event detection
- G01V1/32—Transforming one recording into another or one representation into another
- G01V1/325—Transforming one representation into another
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V2210/00—Details of seismic processing or analysis
- G01V2210/40—Transforming data representation
- G01V2210/42—Waveform, i.e. using raw or pre-filtered trace data
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V2210/00—Details of seismic processing or analysis
- G01V2210/50—Corrections or adjustments related to wave propagation
- G01V2210/51—Migration
- G01V2210/512—Pre-stack
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V2210/00—Details of seismic processing or analysis
- G01V2210/70—Other details related to processing
- G01V2210/74—Visualisation of seismic data
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Geophysics (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geology (AREA)
- Environmental & Geological Engineering (AREA)
- Acoustics & Sound (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明公开了一种基于均值偏移聚类分析的地震初至波自动拾取方法,对地震数据进行预处理,将波形信息转化为点密度信息,对预处理后的记录进行聚类,给定一个具有较高信噪比的道作为开始拾取的初始道,问问初始道开始,根据最小时间差的原则对初至对应的聚类中心进行优选,针对初至波振幅最强的特征,利用MeanShift聚类算法对单炮记录进行处理,对聚类结果进行优选,得到对应的初至时间,作为自动拾取的结果。本发明不需要事先知道样本数据的概率密度分布函数,完全依靠对样本点的计算,而且在采样充分的情况下一定收敛,可以对服从任意分布的数据进行密度估计。
Description
技术领域
本发明涉及一种地震初至波自动拾取方法,尤其涉及一种基于均值偏移聚类分析的地震初至波自动拾取方法。
背景技术
地震勘探是如今使用最为普遍的寻找和查明油气资源的勘探方法之一。其中地震数据的处理环节对后续的构造解释和寻找目标油气藏中起着重要作用。初至拾取是地震数据处理的前期工作,对仪器最先接收到的有效波,即初至波进行拾取。在地震记录中初至波具有较强的能量,地质构造较为简单时,可以直接在地震记录上较为容易地进行初至拾取,但在地质条件比较复杂的地方,地震记录上各种波形干扰复杂多变,并不容易直接观察,此时初至波的精确拾取困难较大。在地震勘探领域中,相对于获取动力学信息,获取地震波的运动学信息,即地震波的走时非常的重要。在地震波场中,初至波起跳时间由于初至震相可追踪易识别的特性,在地震勘探领域占有很重要的地位,可以很广泛的应用在叠前偏移、叠前速度分析、VSP资料解释和地震走时层析成像等处理中。初至的精确与否会影响到后续的处理质量。在折射波和面波勘探中,常用初至波的旅行时来计算表层的速度和层厚等介质参数。初至拾取是地表低降速带静校正的基础,特别是在地表速度较为复杂的地区,这种静校正更为重要也更为复杂。在地震数据处理时,可以应用地震记录的初至或初至折射波求取静校正量,这种方法在很多地震地质条件地区的资料处理中得到应用且效果显著。因此在地震勘探中,精确拾取炮点到检波点的地震波初至时间是一项既基础又非常重要的工作。
通过人工手动拾取是最原始的初至获取方式,这种方法可以适用于工作量比较小的工区,但是在面对工作量比较大的情况,人工拾取就要消耗大量的时间和精力,同时,人工拾取得到的结果好坏会受到处理者水平的影响,而且在巨大的工作量面前,人工难免出错。
发明内容
本发明的目的在于提供一种基于均值偏移聚类分析的地震初至波自动拾取方法,该方法能够在一组数据的密度分布中寻找局部极值,是一种稳定的无参特征空间估计方法,拾取方法指向概率密度梯度方向,通过迭代收敛到概率密度函数的一个稳态点,自动拾取相对准确的初至波时间。
本发明采用如下技术方案实现:
一种基于均值偏移聚类分析的地震初至波自动拾取方法,其特征在于,该方法包括如下步骤:
一)对地震数据进行预处理,将波形信息转化为点密度信息,用不同大小的点表示小波样本点的不同幅度,将幅度值和点密度相关联,波形信息转化的作用是利用均值偏移算法找到更高密度的区域;
二)、对预处理后的记录进行聚类,选中其中符合初至波特征的聚类中心,给定一个具有较高信噪比的道作为开始拾取的初始道。
三)从所述初始道开始,根据最小时间差的原则对初至波对应的聚类中心进行优选,针对初至波振幅最强的特征,利用均值偏移聚类算法对单炮记录进行处理,对聚类结果进行优选,得到对应的初至时间,作为自动拾取的结果。
进一步的,其特征在于,在步骤一)中,将波形信息转化为点密度信息,指的是将振幅大小转换为点密度大小。
本发明的有益技术效果是:通过均值偏移聚类分析的方法,对地震波的初至时间进行自动拾取,属于机器学习方法,更适合大数据的分析和应用,通过对地震数据的标准化和归一化,可提升聚类分析的效果,均值偏移(MeanShift)算法本质是一个迭代的过程,它能够在一组数据的密度分布中寻找到局部极值,它比较稳定,而且是无参密度估计,它不需要事先知道样本数据的概率密度分布函数,完全依靠对样本点的计算,而且在采样充分的情况下一定收敛,可以对服从任意分布的数据进行密度估计。
附图说明
图1是MeanShift(均值偏移)聚类过程示意图。
图2为地震资料波形信息预处理过程。
图3为合成的单炮记录,实际速度为1500m/s,对其进行50ms时移,以及使用2000m/s作为线性动校正速度进行线性动校正后的炮集。
图4为均值偏移聚类,深色区域代表数据密度,浅灰色区域每个点的中心代表聚类中心。
图5为经过线性动校正后的合成炮集,被蓝点覆盖的部分表示均值偏移聚类拾取的初至部分。
图6为实际地震的单炮记录结果,对其进行100ms的时移,之后进行线性动校正。
图7为直接进行均值偏移聚类的结果。
图8为聚类中心和地震记录的对比结果。
图9为聚类中No.1的聚类中心对应的初至波。
图10为经过重新选择的聚类中心。
图11为进行反向线性动校正后的初至波拾取结果。
具体实施方式
通过下面对实施例的描述,将更加有助于公众理解本发明,但不能也不应当将申请人所给出的具体的实施例视为对本发明技术方案的限制,任何对部件或技术特征的定义进行改变和/或对整体结构作形式的而非实质的变换都应视为本发明的技术方案所限定的保护范围。
随着计算机的应用和普及,数学方法、图像方法以及人机交互的引入,现在已经可以实现通过计算机对初至波进行自动拾取。从上世纪70 年代开始,有关于初至波拾取的相关理论逐渐被提出,很多不同的理论被引用到初至波的自动拾取研究中,从而使得初至波拾取的方法研究得到了很大的发展。初至波的自动拾取方法总体可以分为四类:第一类方法是基于地震记录的瞬时特征,包括极值法,能量比法等。理论清晰,算法简单,易于操作,但此类方法对噪音较为敏感,当噪音比较严重时,这类方法效果较差;第二类方法是基于地震记录的整体特征,包括约束法、相关法、最小平方预测法等。这些方法对噪音有一定的压制,不太受波形影响,但会受到地震道间的相似性影响,在地表情况复杂区块,仍需人机交互半自动拾取;第三类方法是基于地震记录中初至波的多维信息,包括神经网络法、分形分维法、模式识别等。此类方法属于人工智能方法,在压制噪音和拾取精确性方面效果明显;第四类方法是基于数字图像处理法,包括基于边缘检测和边界追踪等技术。由初至波的振幅在图像,运用较为成熟的数字图像处理技术进行拾取。这些方法的提出有效地降低了人工工作的工作量,也提高了拾取初至的稳定性和准确性。这些方法之间有相同之处,也各有其特点,面对不同的地震资料,各类算法有其自己的优势。
野外静校正的目的是消除由地形和风化层引起的反射同相轴错位,而静校正的效果取决于初至拾取的精确度。初至拾取的复杂性源于数据本身,通常情况下由于测量设备本身或其他因素的影响,特别是在地形复杂和风化层复杂的区域内,初至波会被噪声破坏,这使得传统的分析方法具有一定的缺陷。均值偏移聚类算法在一组数据的密度分布中寻找局部极值,是一种稳定的无参特征空间估计方法,MeanShift指向概率密度梯度增大的方向,通过迭代收敛到概率密度函数的一个稳态点,通过均值偏移聚类来自动拾取相对准确的初至波时间。
静校正为地震数据处理中的专有名词,消除因激发条件和接受条件变化(主要是由于地形起伏和近地表速度结构的变化造成)对反射波所引起的时差,野外静校正是把所有的激发点和接受点都校正到同一面上 (通常这个面为一个水平面),这个面叫基准面。野外静校正的目的是消除由地形和风化层引起的反射轴同相轴错位,而静校正的效果取决于初至拾取的精确度。初至拾取的复杂性源于数据本身,通常情况下由于测量设备本身或其他因素的影响,特别是在地形复杂和风化层复杂的区域内,初至波会被噪声破坏,这使得传统的分析方法具有一定的缺陷。均值偏移聚类算法在一组数据的密度分布中寻找局部极值,是一种稳定的无参特征空间估计方法,MeanShift指向概率密度梯度方向,通过迭代收敛到概率密度函数的一个稳态点。通过均值偏移聚类来自动拾取相对准确的初至波时间。
在本实施例中提出了一种使用均值偏移聚类的机器学习方法,对初至进行自动拾取。拾取过程在经过线性动校正的炮集中进行,经过校正后的直达波和折射波变为水平。对合成数据和实际数据分别进行处理,结果表明,该方法具有鲁棒性和数值稳定性,计算效率较高,易于应用。这种方法能够节省大量人力,提高效率节约成本。所述方法包括:
如图2所示,本实施例首先对合成地震数据进行测试,通过预处理将波形数据转换为均值偏移聚类的输入。图2(a)中的ricker子波波形用不同的点大小表示小波样本点的不同幅度,将幅度值和点密度相关联,如图2(b)中小波样本转换成一组点,表示不同的点密度,振幅越大,点密度越高。得到的聚类中心可以代表初至波的最大振幅,这样的特征可用于进行初至波的自动拾取。在图2中,横轴为时间(单位ms),纵轴为振幅(单位mv)。
如图3所示,图3(a)是一个合成的单炮记录,图3(b)是对其进行50ms时移的结果,图3(c)是进行线性动校正后的炮集,实际速度为 1500m/s,使用2000m/s作为线性动校正速度。
如图4所示,图4是均值偏移聚类的结果,深色区域代表数据密度,浅灰色区域每个点的中心代表聚类中心。
图5是经过线性动校正后的炮集,被蓝点覆盖的部分表示均值偏移聚类拾取的初至部分,因为合成地震记录不存在噪声,自动拾取的聚类中心可以与初至波完全匹配。
图6(a)是实际单炮记录,图6(b)是进行100ms时移结果,图6 (c)是对其进行线性动校正结果。
图7是实际记录直接进行均值偏移聚类的结果。地震图中的每一道都被分配进不同的聚类。
图8将得到的聚类中心和地震记录的对比,所有与初至波对应的点都已被自动选中,但同时也有很多表示噪声的无用点也被自动选中。
图9是由聚类中No.1的聚类中心对应的初至。
图10是从具有较高的信噪比的道中选择初始道,根据最小时间差的原则,经过重新选择的聚类中心,它们可与初至波完全匹配。
图11是进行反向线性动校正后的初至波拾取结果。
在传统的方法中,初至波拾取是手动完成的,较为耗时。关于自动拾取地震初至波的方法,大都以振幅、频率、相位作为初至波的判断依据,如能量比值法、最大振幅法、分形维法以及人工神经网络法,这一类算法都是基于单一地震道初至波的属性特征。还有基于多道地震道初至波特征的方法,如相关法、图像法。1972年,Peraldi和Clement提出拐点较正法,将地震道与参考道互相关,互相关函数进行归一化后的最大值即为初至;1982年,Hatherrly提出将线性最小平方预测技术与拐点校正相结合,首先识别第一个峰值和拐点,然后再估算二者的统计误差; 1983年,Gelchinsky和Shtivelman提出相邻道互相关的方法,假设各道脉冲形状不变,但与实际不符;1985年,Coppens提出滑动时窗能量比值法,初至时间为最大能量比值所对应的时间;1987年,黄成之等提出用统计方法把信号和噪音分成两个部分,两部分统计特征差别最大的即为初至时间点;1990年,陈遵德等提出模糊检测方法,该方法是运用初至波的隶属函数确定初至波;1993年,Boschetti等提出基于分形维的算法,该方法依据地震道随信号发生分形维值变化的特点来确定初至;1994 年,庄东海等提出将初至拾取看做一个模式的识别过程,基于瞬时特征和整体特征,用人工神经网络法进行初至拾取;1995年,江玉乐等提出同极性能量比法,是改进的能量比法;1997年,常旭等提出以分形理论为基础的方法,该方法运用了Hausdorff分数维来进行初至波的识别;1999 年,Leonard和Kennett提出利用自回归技术对多道或单道数据进行初至拾取;1999年,Mallat提出小波变换可以用于初至波拾取中;2002年,张军华等提出通过小波变换将地震道分成很多不同的通道,与能量比结合进行更好地拾取初至;2002年,曾富英等提出分形维方法来拾取初至波,基于分形理论,通过计算地震道的分数维,认为地震序列分数维的突变便是地震初至波的位置;2006年,潘树林等提出用图像处理的理论进行初至拾取,该方法运用了噪音和初至波边界与图像边沿的相似性; 2006年,李辉峰等人提出引用边缘检测理论进行初至拾取;2007年,王金峰等提出了基于神经网络的改进,并有效地应用在初至拾取;2009年,陈昕等人提出利用S变换进行初至拾取,基于初至起跳前后存在明显的频率差异,时频图上的明显能量聚集确定初至;2010年,黄汉明等人提出利用经验模态分解和小波变换结合进行初至拾取。尽管有关初至拾取尤其是自动化拾取的方法很多,但有关如何更加精确拾取的研究探索一直没停止过。因为实际情况的复杂性以及实际资料的多变性,很多时候为了提高最后的准确度还是需要一定人工的辅助。2012年,徐钰等人在滑动时窗能量比值法的基础上提出了多时窗能量比法,将能量比次极值也考虑在内,提高拾取精度。2014年,许银坡等人先利用能量比值法初步确定每一道初至波的位置,通过给每一个初至波确定一个可信度来对自动拾取的初至波进行评价,对可信度低的初至波进行二次拾取。
MeanShift概念最早由Fukunaga等(1975)在关于概率密度梯度函数的估计中提出来的,最初是指偏移的均值向量,但随着MeanShift理论的发展,MeanShift的含义也发生了变化,MeanShift算法一般是指一个迭代的步骤,即先算出当前点的偏移均值,移动该点到偏移均值位置,然后以此为新起始点继续移动,直到满足一定的条件结束。Yizong Cheng(1995)对基本的MeanShift算法做了推广,首先Yizong Cheng定义核函数,随着样本与被偏移点的距离不同,单个偏移量对均值偏移向量的贡献也不同,其次设定了权重系数,使不同样本点的重要性不同,大大扩大了MeanShift的适用范围。Comaniciu等(2003)把MeanShift成功运用在特征空间的分析中,在图像平滑和图像分割中都得到了很好的应用。MeanShift算法在满足一定条件下,一定可以收敛到最近的一个概率密度函数的稳态点,可以用来检测概率密度函数。
本实施例是在研究了以下问题的基础之上提出的:
1)野外静校正的目的是消除由地形和风化层引起的反射轴错位,而静校正的效果取决于初至拾取的精确度。初至拾取的复杂性源于数据本身,通常情况下由于测量设备本身或其他因素的影响,特别是在地形复杂和风化层复杂的区域内,初至波会被噪声破坏,这使得传统的分析方法具有一定的缺陷。
2)在传统的方法中,初至波拾取是手动完成的。根据地震数据的数量和质量,初至波拾取的过程可能占据地震数据处理总时间的20%至 30%。除了非常耗时之外,手动拾取的结果也取决于进行拾取的每个专业人士的经验,这种拾取可能会具有倾向性和不可预测性。
3)均值偏移是一种适用于实际数据分析的独立工具。不需要假设数据群上有任何预定的形状,它能够处理任意特征空间。处理过程只依赖于单个参数——带宽的选择。与k-均值算法不同,带宽或窗口大小参数“h”具有物理意义。均值偏移的关键也在于能否选择合适的窗口大小。;
4)直接进行聚类,所有与初至波对应的点都被自动选中,但同时也有很多表示噪声的无用点也被自动选中,需要对聚类中心进行优选,用以区分拾取的初至波和噪声中心。
在地震勘探中,炮点产生地震波之后,检波器接最先收到的地震波称为初至波,这个到达时间称为地震波初至时间。地震勘探初至波拾取结果的准确与否,影响着后续静校正量的求取,也影响着近地表速度层析成像反演的质量。初至拾取对于山地、沙漠等地形复杂的地区尤为重要,是后续地震数据处理工作的关键。采用手工拾取地震初至波的方法,效率低下,限制了数据处理的速度。目前一般采用初至拾取算法来自动拾取初至波。在当前已有的上百种算法中,按照算法中处理的数据的特征,可把这些算法分为两类:一类是基于单一地震道初至波属性特征的方法,如最大能量法、能量比值法、振幅比值法、神经网络法;另一类是基于多道地震道初至波特征的方法,如图像法。
在本实施例中,单炮记录是地震数据处理中的专有名词,是地震数据呈现的一种视图。地震资料采集包括两个环节——地震波激发和接收。单炮记录是指一点激发、多点接收(多指中间激发、两侧不同偏移距接收)产生的一种视图。
聚类把相似的样本划分到同一个簇,使得同在一个簇里的所有样本具有相似的特征或属性,而把不相似的样本划分到不同簇。聚类分析在机器学习,数据挖掘,模式识别等领域都受到广泛的应用。一些传统的聚类算法一般有两个固有的弱点:需要事先指定簇的个数;对应簇的形状或分布有要求,如k-means只能找到圆形的簇。而MeanShift算法能有效地克服以上缺点。簇的个数自动确定,且能找到任意形状的簇。它首先对每个样本点进行概率密度估计,并不断把该点往邻域内密度增加最大的方向移动直至收敛到一个模。所有收敛到同一个模的样本点定义了一个簇。
如图所示,在图8中,聚类中心和地震记录进行对比,从地震图中以看到所有与初至波对应的点都已被自动选中,但同时也有很多表示噪声的无用点也被自动选中。在本实施例中,我们选取图8中符合初至波聚类中心特征的数据,给定一个具有较高信噪比的道作为开始拾取的初始道。
在图9中信噪比较高的区域,如单炮记录中间部分的左右两侧,符合初至波特征的聚类中心和初至波完全重合。但是在信噪比较低、噪声较大的区域,例如右侧远偏移距的道中,符合初至波特征的聚类中心和初至波波形并不完全匹配。在本实施例中,我们参考附近道的初至波,采用最小时间差的原则来重新选择初至对应的聚类中心。首先,给定一个开始拾取的初始道,初始道应该具有较高的信噪比。图10是经过重新选择的聚类中心,它们可与初至波完全匹配。图11是进行反向线性动校正后的初至波拾取结果。
基本Mean Shift:
给定d维空间Rd中的n个样本点xi,i=1,…,n,在x点的Mean Shift向量的基本形式定义为:
其中,Sh是一个半径为h的高维球区域,满足以下关系的y点的集合:
Sh(x)≡{y:(y-x)T(y-x)≤h2} (2)
k表示在这n个样本点xi中,有k个点落入Sh区域中。我们可以看到 (xi-x)是样本点xi相对于点x的偏移向量,Mean Shift向量Mh(x)就是对落入区域Sh中的k个样本点相对于点x的偏移向量求和再平均。从直观上看,如果样本点xi从一个概率密度函数f(x)中采样得到,由于非零的概率密度梯度指向概率密度增加最大的方向,因此从平均上来说,Sh区域内的样本点更多的落在沿着概率密度梯度的方向。因此,对应的Mean Shift向量Mh(x)应该指向概率密度梯度的方向。
(1)核函数:
定义X代表一个d维的欧氏空间,x是该空间中的一个点,用一列向量表示.x的模||x||2=xTx.R表示实数域.如果一个函数K:X→R存在一个剖面函数k:[0,∞]→R,即
K(x)=k(||x||2) (3)
并且满足:k是非负的;k是非增的,即如果a<b那么k(a)≥k(b);k 是分段连续的,且那么函数K(x)就被称为核函数。
单位均匀核函数:
单位高斯核函数:
(2)Mean Shift扩展形式
从基本MeanShift形式中可以看到只要是落入Sh的采样点,无论其离 x远近,对最终的Mh(x)计算的贡献是一样的。但一般的说来离x越近的采样点对估计x周围的统计特性越有效,因此引入核函数,在计算Mh(x)时考虑距离的影响,同时认为在所有的样本点xi中重要性并不一样,因此对每个样本都引入一个权重系数,把基本的Mean Shift形式扩展为:
其中:GH(xi-x)=|H|-1/2G(H-1/2(xi-x)),G(x)是一个单位核函数(均匀核函数或高斯核函数),H是一个正定的对称d×d矩阵,称之为带宽矩阵, w(xi)≥0是一个赋给采样点xi的权重。因此(6)式又可写为:
(3)Mean Shift算法步骤
Mean Shift扩展形式可以得到
把上式右边的第一项记为mh(x)
给定一个初始点x,核函数G(X),容许误差ε,Mean Shift算法循环的执行下面三步,直至结束条件满足
(1).计算mh(x)
(2).把mh(x)赋给x
(3).如果||mh(x)-x||<ε,结束循环;若不然,继续执行(1)
mh(x)=x+Mh(x),因此步骤不断的沿着概率密度的梯度方向移动,同时步长不仅与梯度的大小有关,也与该点的概率密度有关,在密度大的地方,更接近要找的概率密度的峰值,Mean Shift算法使得移动的步长小一些,相反,在密度小的地方,移动的步长就大一些.在满足一定条件下, Mean Shift算法一定会收敛到该点附近的峰值。
综上所述可见,在本实施例中提出了一种新的无监督机器学习方法,即均值偏移聚类,进行初至波的自动拾取。为了完成均值偏移聚类自动拾取,首先对地震单炮记录进行预处理,预处理的关键作用是将振幅大小转换为点密度大小。当单炮记录具有较高信噪比时,聚类中心可以和初至波完全自动匹配。而在被噪声破坏的地震数据中,应该对聚类中心进行重选。处理后的合成地震数据和实际地震数据表明,该方法是有效和稳定的。提出的方法将有助于地球物理学家减少手动拾取初至波所耗费的时间,并通过均值偏移聚类自动拾取来获得相对准确的初至波时间。
当然,本发明还可以有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可以根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (2)
1.一种基于均值偏移聚类分析的地震初至波自动拾取方法,其特征在于,该方法包括如下步骤:
一)对地震数据进行预处理,将波形信息转化为点密度信息,用不同大小的点表示小波样本点的不同幅度,将幅度值和点密度相关联,波形信息转化的作用是利用均值偏移算法找到更高密度的区域;
二)、对预处理后的记录进行聚类,选中其中符合初至波特征的聚类中心,给定一个具有较高信噪比的道作为开始拾取的初始道。
三)从所述初始道开始,根据最小时间差的原则对初至波对应的聚类中心进行优选,针对初至波振幅最强的特征,利用均值偏移聚类算法对单炮记录进行处理,对聚类结果进行优选,得到对应的初至时间,作为自动拾取的结果。
2.根据权利要求1所述的一种基于均值偏移聚类分析的地震初至波自动拾取方法,其特征在于,在步骤一)中,将波形信息转化为点密度信息,指的是将振幅大小转换为点密度大小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910721350.XA CN110441819B (zh) | 2019-08-06 | 2019-08-06 | 一种基于均值偏移聚类分析的地震初至波自动拾取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910721350.XA CN110441819B (zh) | 2019-08-06 | 2019-08-06 | 一种基于均值偏移聚类分析的地震初至波自动拾取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110441819A true CN110441819A (zh) | 2019-11-12 |
CN110441819B CN110441819B (zh) | 2020-10-27 |
Family
ID=68433455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910721350.XA Expired - Fee Related CN110441819B (zh) | 2019-08-06 | 2019-08-06 | 一种基于均值偏移聚类分析的地震初至波自动拾取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110441819B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111427984A (zh) * | 2020-03-24 | 2020-07-17 | 成都理工大学 | 一种区域地震概率空间分布生成方法 |
CN112230270A (zh) * | 2020-12-14 | 2021-01-15 | 西南交通大学 | 一种地震预警方法、装置、设备及可读存储介质 |
CN112765284A (zh) * | 2021-01-21 | 2021-05-07 | 广州羊城通有限公司 | 用户的相关地点确定方法及装置 |
CN113917524A (zh) * | 2020-07-10 | 2022-01-11 | 中国石油化工股份有限公司 | 基于无缆节点台站的近地表精细探测方法 |
CN114114416A (zh) * | 2021-11-26 | 2022-03-01 | 同济大学 | 一种基于强噪音弱信号检测的初至拾取方法 |
WO2022166380A1 (zh) * | 2021-02-05 | 2022-08-11 | 天翼数字生活科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
US11467302B1 (en) | 2021-05-26 | 2022-10-11 | Saudi Arabian Oil Company | Seismic first breaks onset times determination by interface tracking using level-sets method |
CN116804668A (zh) * | 2023-08-23 | 2023-09-26 | 国盐检测(天津)有限责任公司 | 一种食盐碘含量检测数据标识方法及系统 |
CN117060597A (zh) * | 2023-08-23 | 2023-11-14 | 嘉兴正弦电气有限公司 | 一种储能电站的储能协调控制方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106896407A (zh) * | 2017-03-28 | 2017-06-27 | 吉林大学 | 一种基于近似负熵的微地震信号初至拾取方法 |
CN108919353A (zh) * | 2018-07-03 | 2018-11-30 | 华北科技学院 | 一种微震波形初至到时的自动分级拾取与优选方法 |
-
2019
- 2019-08-06 CN CN201910721350.XA patent/CN110441819B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106896407A (zh) * | 2017-03-28 | 2017-06-27 | 吉林大学 | 一种基于近似负熵的微地震信号初至拾取方法 |
CN108919353A (zh) * | 2018-07-03 | 2018-11-30 | 华北科技学院 | 一种微震波形初至到时的自动分级拾取与优选方法 |
Non-Patent Citations (2)
Title |
---|
朱丹: "基于FCM的微地震初至自动拾取算法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 * |
罗光: "高密点地震信号废道自动识别及初至拾取方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111427984B (zh) * | 2020-03-24 | 2022-04-01 | 成都理工大学 | 一种区域地震概率空间分布生成方法 |
CN111427984A (zh) * | 2020-03-24 | 2020-07-17 | 成都理工大学 | 一种区域地震概率空间分布生成方法 |
CN113917524A (zh) * | 2020-07-10 | 2022-01-11 | 中国石油化工股份有限公司 | 基于无缆节点台站的近地表精细探测方法 |
CN113917524B (zh) * | 2020-07-10 | 2024-03-29 | 中国石油化工股份有限公司 | 基于无缆节点台站的近地表精细探测方法 |
CN112230270A (zh) * | 2020-12-14 | 2021-01-15 | 西南交通大学 | 一种地震预警方法、装置、设备及可读存储介质 |
CN112230270B (zh) * | 2020-12-14 | 2021-03-09 | 西南交通大学 | 一种地震预警方法、装置、设备及可读存储介质 |
CN112765284A (zh) * | 2021-01-21 | 2021-05-07 | 广州羊城通有限公司 | 用户的相关地点确定方法及装置 |
WO2022166380A1 (zh) * | 2021-02-05 | 2022-08-11 | 天翼数字生活科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
US11467302B1 (en) | 2021-05-26 | 2022-10-11 | Saudi Arabian Oil Company | Seismic first breaks onset times determination by interface tracking using level-sets method |
CN114114416A (zh) * | 2021-11-26 | 2022-03-01 | 同济大学 | 一种基于强噪音弱信号检测的初至拾取方法 |
CN116804668A (zh) * | 2023-08-23 | 2023-09-26 | 国盐检测(天津)有限责任公司 | 一种食盐碘含量检测数据标识方法及系统 |
CN117060597A (zh) * | 2023-08-23 | 2023-11-14 | 嘉兴正弦电气有限公司 | 一种储能电站的储能协调控制方法及系统 |
CN116804668B (zh) * | 2023-08-23 | 2023-11-21 | 国盐检测(天津)有限责任公司 | 一种食盐碘含量检测数据标识方法及系统 |
CN117060597B (zh) * | 2023-08-23 | 2024-05-07 | 嘉兴正弦电气有限公司 | 一种储能电站的储能协调控制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110441819B (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110441819A (zh) | 一种基于均值偏移聚类分析的地震初至波自动拾取方法 | |
Dai et al. | The application of back‐propagation neural network to automatic picking seismic arrivals from single‐component recordings | |
EP3894906A1 (en) | Training machine learning systems for seismic interpretation | |
CN109001801B (zh) | 基于多次迭代蚁群算法的断层变尺度识别方法 | |
CN109800624A (zh) | 一种基于行人重识别的多目标跟踪方法 | |
CN112180433B (zh) | 地震初至波拾取方法及装置 | |
CN104570076B (zh) | 一种基于二分法的地震波初至自动拾取方法 | |
CN110609320A (zh) | 一种基于多尺度特征融合的叠前地震反射模式识别方法 | |
CN112884134B (zh) | 面向地震震相识别的基于时域的卷积神经网络模型及应用 | |
CN112036239B (zh) | 一种基于深度学习网络的雷达信号工作模式识别方法及系统 | |
CN115826042B (zh) | 一种边云端结合的分布式地震数据处理方法与装置 | |
Ma et al. | Automatic first arrival picking for borehole seismic data using a pixel-level network | |
CN111025389A (zh) | 多尺度相干降维融合的裂缝预测方法及系统 | |
CN111008991A (zh) | 一种背景感知的相关滤波目标跟踪方法 | |
CN108226997A (zh) | 一种基于叠前地震数据的地震相划分方法 | |
AU2006237348B2 (en) | Method of processing seismic data for AVO or AVOA characterisation | |
Duan et al. | Multi-trace and multi-attribute analysis for first-break picking with the support vector machine | |
CN106772572B (zh) | 一种微地震监测初至的拾取方法 | |
CN113031059B (zh) | 基于视觉认知的环境抑制与轮廓结合模型的地震数据同相轴检测方法 | |
CN108680950B (zh) | 一种基于自适应块匹配的沙漠地震信号位置检测方法 | |
CN116594057B (zh) | 一种基于深度学习和边缘计算的地震预警方法与装置 | |
CN106646377B (zh) | 基于时间序列相似搜索的震动目标定位方法 | |
Ren et al. | BTRPP: A rapid PGA prediction model based on machine learning | |
Liu et al. | A convolutional neural network for seismic dip estimation | |
CN110646846B (zh) | Vti介质各向异性参数确定方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201027 |
|
CF01 | Termination of patent right due to non-payment of annual fee |