CN116070085A - 一种基于密度聚类的井孔模式波有效频散拾取方法和装置 - Google Patents

一种基于密度聚类的井孔模式波有效频散拾取方法和装置 Download PDF

Info

Publication number
CN116070085A
CN116070085A CN202211673398.6A CN202211673398A CN116070085A CN 116070085 A CN116070085 A CN 116070085A CN 202211673398 A CN202211673398 A CN 202211673398A CN 116070085 A CN116070085 A CN 116070085A
Authority
CN
China
Prior art keywords
data
dispersion
density
clustering
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211673398.6A
Other languages
English (en)
Inventor
庄春喜
张恒建
苏远大
李盛清
唐晓明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202211673398.6A priority Critical patent/CN116070085A/zh
Publication of CN116070085A publication Critical patent/CN116070085A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Agronomy & Crop Science (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Husbandry (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明公开了一种基于密度聚类的井孔模式波有效频散拾取方法和装置,包括:通过频散提取算法,从声波测井仪器记录的波形信息中提取出声波的频散信息;对得到的原始频散数据进行范围限定;对得到的限定范围后的数据进行标准化处理;利用DBSCAN算法对得到的数据进行聚类,将数据集划分成不同的簇;对处理得到的数据进行逆标准化处理;通过数据集主簇中包含数据点的个数来判断数据质量的好坏。装置包括:慢度‑频率域变换模块、数据聚类处理模块和目标主簇鉴别模块。本发明可以解决传统的频散分析处理阵列声波测井数据存在的导致慢度‑频率域中存在噪点和伪解点,进而影响后续的频散分析等技术问题。

Description

一种基于密度聚类的井孔模式波有效频散拾取方法和装置
技术领域
本发明涉及应用地球物理和石油勘探开发技术领域,具体涉及一种基于密度聚类的井孔模式波有效频散分离方法。
背景技术
频散分析是处理阵列声波测井数据的重要方法。实际测井中的波形多为频散的井孔模式波,这些频散模式波包括但不限于:单极子源激发的斯通利波和各阶伪瑞利波、偶极子源激发的弯曲波、四级子源激发的螺旋波,以及各种声源在软地层中激发的漏能P波。井孔模式波的频散可以进一步用于地层信息反演。
仪器接收器阵列记录的声波波形信号,首先需要通过特定的频散提取算法将空间-时间域的波形变换到慢度-频率域中进一步提取波形的频散信息。前人已对频散提取方法进行了大量的研究,可以将这些方法分为单模式提取算法和多模式提取算法。Prony方法是最早的多模式提取方法,由Lang等人将其改进并应用于声波测井数据的处理(Lang S W,Kurkjian A L,McClellan J H,et al.Estimating slowness dispersion from arraysof sonic logging waveforms[J].Geophysics,1987,52(4):530-544.);Ekstrom提出了矩阵束(Matrix Pencil)方法,相比Prony方法提高了抗噪能力和计算效率(Ekstrom MP.Dispersion estimation from borehole acoustic arrays using a modified matrixpencil algorithm[C]//Conference Record of the Twenty-Ninth AsilomarConference on Signals,Systems and Computers.IEEE,1996,1:449-453.)。Nolte提出的WSS方法通过构造频谱加权相关函数,提高了计算结果的稳定性(Nolte B,Rao R,HuangX.Dispersion analysis of split flexural waves[R].Massachusetts Institute ofTechnology.Earth Resources Laboratory,1997.),该方法十分适合从仅含弯曲波模态的偶极波列中提取频散,是目前广泛使用的单模式频散提取方法。
虽然频散提取算法已经有了很大发展,但实际测井过程会不可避免地受到噪声和仪器有限工作频带的影响,这就导致慢度-频率域中存在噪点和伪解点,进而影响后续的频散分析。因此,开发一种从含有噪声和伪解的慢度-频率域原始频散中分离出来的数据处理方法是非常必要的。
发明内容
本发明的目的是提供一种基于密度聚类的井孔模式波有效频散拾取方法和装置,以解决传统的频散分析处理阵列声波测井数据存在的导致慢度-频率域中存在噪点和伪解点,进而影响后续的频散分析等技术问题。
本发明采取如下处理方案:
步骤一、通过频散提取算法,包括Prony方法、Matrix Pencil方法或加权频谱相干法,从声波测井仪器记录的波形信息中提取出声波的频散信息;
步骤二、对步骤一得到的原始频散数据进行范围限定;
步骤三、对步骤二得到的限定范围后的数据进行标准化处理;
步骤四、利用DBSCAN算法对步骤三得到的数据进行聚类,将数据集划分成不同的簇;
步骤五、对步骤四处理得到的数据进行逆标准化处理;
步骤六、通过数据集主簇中包含数据点的个数来判断数据质量的好坏,其中默认由不到100个点组成的数据集主簇对应的数据集数据质量较差,但该标准要根据数据集情况做具体调整;对数据质量良好的数据,数据集主簇即为目标频散;对于数据质量较差的数据,我们利用频散曲线的单调性从聚类结果中挑选出合适的簇,这些簇组成了目标频散;
所述步骤三中的标准化处理算法为:
Xstand=(X-μ)/σ         (1)
式中,Xstand是标准化后的数据,X是原始数据,μ和σ分别是样本数据的均值(mean)和标准差(std)。
所述步骤四中的DBSCAN(Density-Based Spatial Clustering of Applicationwith Noise)是一种经典的密度聚类方法,该算法基于ε邻域和ε邻域中包含的最小数据点数MinPts,将数据点和数据点间的关系划分为核心对象、密度直达、密度可达与密度相连,对给定数据集D={x1,x2,x3,…,xm}而言,
(1)若||xj-xi||2≤ε,则称xj位于xi的ε邻域内;
(2)若xi的ε邻域内至少包含MinPts个数据点,则称xi为核心对象;
(3)若xj位于核心对象xi的ε邻域内,则称xj是从xi直接密度可达(directlydensity-reachable)的;
(4)若存在样本序列(p1,p2,p3,…,pn),且pi+1是从pi(i=1,2,3,…n-1)直接密度可达的,则称pn是由p1密度可达(density-reachable)的。显然,样本序列(p1,p2,p3,…,pn)中仅pn可以为非核心对象;
(5)若存在核心对象xi,使得O1和O2均由xi密度可达,则称O1和O2是密度相连(density-connected)的;
所述DBSCAN算法描述为:首先基于一组参数(ε,MinPts)规定的ε邻域确定数据集中的所有核心对象,其次选择任意核心对象xi找出所有由xi密度可达的对象,这些对象的集合即为一个簇,最后对未被归类的核心对象重复上一步,直到所有的核心对象都被归类为止。
本发明还提供了一种密度聚类的井孔模式波有效频散处理装置,包括:
慢度-频率域变换模块,将空间-时间域的波形变换到慢度-频率域,使用频散提取算法提取出声波的频散信息;
数据聚类处理模块,进行频散标准化处理,并利用DBSCAN算法划不同的簇;
目标主簇鉴别模块,对数据质量良好的数据,设定该数据集主簇为目标频散。
本发明具有如下优点:
本发明基于一种名为DBSCAN的密度聚类算法,结合声波频散特征,开发了一套可以进行井孔模式波有效频散分离的数据处理方法。现场数据的应用效果展现了该方法的优势:对常用的单极斯通利波、偶极弯曲波,无论数据质量的优劣,均可实现有效频散的高效分离。
附图说明
图1为本发明基于密度聚类的井孔模式波有效频散分离算法流程图。
图2本发明提供的密度聚类的井孔模式波有效频散拾取处理装置的组成结构图。
图3(a)、(b)、(c)、(d)为本发明算法对偶极弯曲波频散的分离效果。
图4(a)、(b)为本发明算法分离出的单极斯通利波频散。
图5(a)、(b)为本发明算法从数据质量差的现场数据中分离出的偶极弯曲波频散。
具体实施方式
下面结合附图和具体处理实例对本发明方法作进一步说明,以使本领域的技术人员可以更好地理解本方法并能予以实施,但所举实例不作为对本发明的限定。
本发明提出了一种基于密度聚类的井孔模式波有效频散分离算法,参见图1所示,工作流程如下:
步骤一、声波测井仪器记录的是波形信息,需要通过Prony方法、Matrix Pencil方法或加权频谱相干法等频散提取算法从中提取出声波的频散信息。
使用加权频谱相干法,对一个现场偶极声波测井资料进行频散提取,结果如图2所示。图3(a)展示了一个弯曲波波形,图3(b)展示了从中提取的频散,可见除弯曲波频散外,加权频谱相干法还提取出许多错误的模态,这对声波资料的频散分析制造了阻碍。
步骤二、现场声波数据受仪器因素、井壁坍塌、地层非均质性等因素的影响,波形信号中会包含大量的噪音,从中提取的频散会出现一些远超常规范围的噪点,这些噪点会对数据标准化造成很大的影响,进而影响降噪效果。因此,对现场数据进行范围限定后,才能利用密度聚类算法进行频散分离处理。
步骤三、因为数据点间的距离是影响DBSCAN算法效果的关键因素,而频率与速度的量纲不同且范围差异较大,这可能会导致距离的计算依赖于速度而相对忽略频率,进而影响降噪效果。此外,原始数据点之间的距离分布范围较大,这会导致聚类结果对ε邻域参数的改变不敏感。因此,在对数据进行聚类之前,需要通过数据标准化,消除量纲影响,提升算法效果。
步骤四、聚类算法属于无监督学习算法,是一种按照特定标准,将数据集划分为不同的子集,将每个子集称为一个“簇”,使相同簇中数据的相似性与不同簇间数据的差异性尽可能大的数据分析方法。对于形状不规则的簇,k-means这类假设簇是凸形簇结构的聚类算法不再适用,而密度聚类算法将簇视为被低密度区域分隔开的高密度区域,可以划分出任意形状的簇,且不需要先验地设置簇的个数,在处理具有不规则簇的数据集上具有很大优势。DBSCAN(Density-Based Spatial Clustering of Application with Noise)是一种经典的密度聚类方法,该算法基于ε邻域和ε邻域中包含的最小数据点数MinPts,将数据点和数据点间的关系划分为核心对象、密度直达、密度可达与密度相连,对给定数据集D={x1,x2,x3,…,xm}而言,
(1)若||xj-xi||2≤ε,则称xj位于xi的ε邻域内。
(2)若xi的ε邻域内至少包含MinPts个数据点,则称xi为核心对象。
(3)若xj位于核心对象xi的ε邻域内,则称xj是从xi直接密度可达(directlydensity-reachable)的。
(4)若存在样本序列(p1,p2,p3,…,pn),且pi+1是从pi(i=1,2,3,…n-1)直接密度可达的,则称pn是由p1密度可达(density-reachable)的。显然,样本序列(p1,p2,p3,…,pn)中仅pn可以为非核心对象。
(5)若存在核心对象xi,使得O1和O2均由xi密度可达,则称O1和O2是密度相连(density-connected)的。
DBSCAN算法描述为:首先基于一组参数(ε,MinPts)规定的ε邻域确定数据集中的所有核心对象,其次选择任意核心对象xi找出所有由xi密度可达的对象,这些对象的集合即为一个簇,最后对未被归类的核心对象重复上一步,直到所有的核心对象都被归类为止。
图3(c)展示了利用DBSCAN算法对图3(b)中合成频散数据进行降噪的效果,可见整个数据集由不同符号表示的11个簇,以及不归属于任何簇的以“×”表示的噪声点组成。
步骤五、我们将数据集中的噪声数据以及起始于0Hz的簇去除,剩余簇中包含数据点最多的簇我们称之为数据集主簇。将去除噪声后的聚类数据进行逆标准化处理,要注意的是逆标准化处理的参数与标准化处理时的参数要保持一致。
步骤六、通过数据集主簇中包含数据点的个数来判断数据质量的好坏,我们默认由不到100个点组成的数据集主簇对应的数据集数据质量较差,但该标准要根据数据集情况做具体调整;对数据质量良好的数据,数据集主簇即为目标频散;对于数据质量较差的数据,我们利用频散曲线的单调性从聚类结果中挑选出合适的簇,这些簇组成了目标频散。
基于同一发明构思,本发明实施方式中还提供了一种密度聚类的井孔模式波有效频散处理装置,如下面的实施方式所述。由于装置解决问题的原理与基于密度聚类的井孔模式波有效频散处理方法相似,因此装置的实施可以参见密度聚类的井孔模式波有效频散处理方法的实施,重复之处不再赘述。以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。请参阅图2,是本申请实施方式的密度聚类的井孔模式波有效频散提取装置的一种组成结构图,该装置可以包括:慢度-频率域变换模块、数据聚类处理模块、目标主簇鉴别模块,下面对该结构进行具体说明。
慢度-频率域变换模块,将空间-时间域的波形变换到慢度-频率域,使用频散提取算法提取出声波的频散信息;
数据聚类处理模块,进行频散标准化处理,并利用DBSCAN算法划不同的簇;
目标主簇鉴别模块,对数据质量良好的数据,设定该数据集主簇为目标频散。
以下,结合具体的测井实例处理成果,进一步说明本发明所述的密度聚类的井孔模式波有效频散提取方法的应用效果。
图4(a)、(b)和图5(a)、(b)进一步展示了密度聚类算法对某井X765.881m处的单极和偶极数据的频散分离效果:单极数据质量较好,不需要对密度聚类算法进行额外调整即可实现斯通利波频散的分离,结果如图3(a)、(b)、(c)、(d)所示;偶极数据质量较差,弯曲波频散在3kHz附近出现异常跳跃,导致了密度聚类算法将其划分为几个不同的簇,我们根据弯曲波频散的单调性,选择随频率上升平均速度下降的簇,将这种数据质量差的弯曲波频散分离出来,结果如图5(a)(b)所示。
在图3(a)中,横坐标为时间(ms),在纵坐标为源距(m)。在图3(b)、(c)、(d)、图4(a)、(b)、图5(a)、(b)中,横坐标为频率(kHz),纵坐标为速度(km/s)。
以上所述实例仅是为充分说明本发明方法所举的较佳的实例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权力要求书为准。

Claims (2)

1.一种基于密度聚类的井孔模式波有效频散拾取方法,包括如下步骤:
步骤一、通过频散提取算法,包括Prony方法、Matrix Pencil方法或加权频谱相干法,从声波测井仪器记录的波形信息中提取出声波的频散信息;
步骤二、对步骤一得到的原始频散数据进行范围限定;
步骤三、对步骤二得到的限定范围后的数据进行标准化处理;
步骤四、利用DBSCAN算法对步骤三得到的数据进行聚类,将数据集划分成不同的簇;
步骤五、对步骤四处理得到的数据进行逆标准化处理;
步骤六、通过数据集主簇中包含数据点的个数来判断数据质量的好坏,其中默认由不到100个点组成的数据集主簇对应的数据集数据质量较差,但该标准要根据数据集情况做具体调整;对数据质量良好的数据,数据集主簇即为目标频散;对于数据质量较差的数据,我们利用频散曲线的单调性从聚类结果中挑选出合适的簇,这些簇组成了目标频散;
所述步骤三中的标准化处理算法为:
Xstand=(X-μ)/σ      (1)
式中,Xstand是标准化后的数据,X是原始数据,μ和σ分别是样本数据的均值(mean)和标准差(std);
所述步骤四中的DBSCAN算法基于ε邻域和ε邻域中包含的最小数据点数MinPts,将数据点和数据点间的关系划分为核心对象、密度直达、密度可达与密度相连,对给定数据集D={x1,x2,x3,…,xm}而言,
(1)若||xj-xi||2≤ε,则称xj位于xi的ε邻域内;
(2)若xi的ε邻域内至少包含MinPts个数据点,则称xi为核心对象;
(3)若xj位于核心对象xi的ε邻域内,则称xj是从xi直接密度可达的;
(4)若存在样本序列(p1,p2,p3,…,pn),且pi+1是从pi(i=1,2,3,…n-1)直接密度可达的,则称pn是由p1密度可达的;显然,样本序列(p1,p2,p3,…,pn)中仅pn可以为非核心对象;
(5)若存在核心对象xi,使得O1和O2均由xi密度可达,则称O1和O2是密度相连的;
所述DBSCAN算法描述为:首先基于一组参数(ε,MinPts)规定的ε邻域确定数据集中的所有核心对象,其次选择任意核心对象xi找出所有由xi密度可达的对象,这些对象的集合即为一个簇,最后对未被归类的核心对象重复上一步,直到所有的核心对象都被归类为止。
2.根据权利要求1所述的一种基于密度聚类的井孔模式波有效频散拾取方法,实现上述方法的一种密度聚类的井孔模式波有效频散处理装置,其特征在于,包括:
慢度-频率域变换模块,将空间-时间域的波形变换到慢度-频率域,使用频散提取算法提取出声波的频散信息;
数据聚类处理模块,进行频散标准化处理,并利用DBSCAN算法划不同的簇;
目标主簇鉴别模块,对数据质量良好的数据,设定该数据集主簇为目标频散。
CN202211673398.6A 2022-12-26 2022-12-26 一种基于密度聚类的井孔模式波有效频散拾取方法和装置 Pending CN116070085A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211673398.6A CN116070085A (zh) 2022-12-26 2022-12-26 一种基于密度聚类的井孔模式波有效频散拾取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211673398.6A CN116070085A (zh) 2022-12-26 2022-12-26 一种基于密度聚类的井孔模式波有效频散拾取方法和装置

Publications (1)

Publication Number Publication Date
CN116070085A true CN116070085A (zh) 2023-05-05

Family

ID=86176111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211673398.6A Pending CN116070085A (zh) 2022-12-26 2022-12-26 一种基于密度聚类的井孔模式波有效频散拾取方法和装置

Country Status (1)

Country Link
CN (1) CN116070085A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117310452A (zh) * 2023-11-29 2023-12-29 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 电磁信号泄露的确定方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117310452A (zh) * 2023-11-29 2023-12-29 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 电磁信号泄露的确定方法、装置、计算机设备和存储介质
CN117310452B (zh) * 2023-11-29 2024-03-26 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 电磁信号泄露的确定方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN102870155B (zh) 处理音频信号的方法和装置
CN113642698B (zh) 地球物理测井智能解释方法、系统及存储介质
CN116070085A (zh) 一种基于密度聚类的井孔模式波有效频散拾取方法和装置
CN103854660B (zh) 一种基于独立成分分析的四麦克语音增强方法
Koerich et al. Cross-representation transferability of adversarial attacks: From spectrograms to audio waveforms
CN114492521A (zh) 一种基于声振信号的随钻岩性智能识别方法与系统
Wang et al. A novel underground pipeline surveillance system based on hybrid acoustic features
CN110544482A (zh) 一种单通道语音分离系统
CN109920447B (zh) 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法
Li et al. Data augmentation method for underwater acoustic target recognition based on underwater acoustic channel modeling and transfer learning
Chatterjee et al. Learning audio-visual dynamics using scene graphs for audio source separation
Bregman et al. Aftershock identification using diffusion maps
CN110444225B (zh) 基于特征融合网络的声源目标识别方法
CN116383719A (zh) 一种用于lfm雷达的mgf射频指纹识别方法
CN110007341B (zh) 一种基于IfnoGAN和SSD模型的微地震有效信号的识别方法及系统
CN116756486A (zh) 基于声光电磁多源数据融合的海上目标识别方法及装置
CN114613384B (zh) 一种基于深度学习多输入语音信号波束形成信息互补方法
CN110580915A (zh) 基于可穿戴式设备的声源目标识别系统
Cheng et al. Multiscale recurrent-guided denoising network for distributed acoustic sensing-vertical seismic profile background noise attenuation
CN113869289B (zh) 基于熵的多通道舰船辐射噪声特征提取方法
Karnjana et al. An audio watermarking scheme based on automatic parameterized singular-spectrum analysis using differential evolution
CN115641868A (zh) 音频分离方法、装置、电子设备及计算机可读存储介质
Naoi et al. Efficient similar waveform search using short binary codes obtained through a deep hashing technique
CN111274989A (zh) 一种基于深度学习的野外车辆识别方法
Ren et al. Classification of tectonic and nontectonic earthquakes by an integrated learning algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination