CN116051573A - 基于深度元学习的模测震图纸矢量化方法 - Google Patents

基于深度元学习的模测震图纸矢量化方法 Download PDF

Info

Publication number
CN116051573A
CN116051573A CN202211687670.6A CN202211687670A CN116051573A CN 116051573 A CN116051573 A CN 116051573A CN 202211687670 A CN202211687670 A CN 202211687670A CN 116051573 A CN116051573 A CN 116051573A
Authority
CN
China
Prior art keywords
waveform
point
vibration
time
wave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211687670.6A
Other languages
English (en)
Inventor
王茂发
龚启舟
袁静
刘振丙
单维锋
张润杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202211687670.6A priority Critical patent/CN116051573A/zh
Publication of CN116051573A publication Critical patent/CN116051573A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明公开了基于深度元学习的模拟测震图纸矢量化方法,该方法通过使用多尺度图像分割技术,使现有架构能够自动、快速确定扫描图纸的尺寸;自动提取图纸中各项记录参数;针对多尺度的图纸设计最佳的尺寸归一化、类型分类、灰度化及图像分割算法,从而为后续矢量化模型提供优质的输入数据,解决了原有矢量化算法存在的目标图纸的单一的问题;采用时间标记点模板匹配算法和自动拾取算法,自动完成对图纸中显著时间标记点的检测与标定,从而有效降低在时间坐标系构架过程中的人力消耗,进而达到提高图纸矢量化效率的目的。

Description

基于深度元学习的模测震图纸矢量化方法
技术领域
本发明涉及人工智能领域,具体是一种基于深度元学习的模测震图纸矢量化方法。
背景技术
模测震波形记录是早期使用地震监测仪得到的一种纸介地震监测记录,其是将一段时间(如1天)3个方向(东西、南北、上下)的地震波动记录在一张图纸上,由于图纸长度有限,需要将波动信息逐行打印,同时也需要人工标记或填入台站信息、地震仪型号、记录时间、对钟信息、三个方向的速度、记录人员信息等。模测震波形记录一般以纸质形式保存,现阶段通常会采用宽幅扫描仪进行扫描,以栅格化形式完成物理性永久保存,以克服温度、湿度及自然条件下机械性破坏。
在实际应用中,需要的是矢量化后的数字化模测震数据。目前,横跨于扫描图纸和数字化数据间,仍有三大关键问题亟待解决:
1)模测震波形数据存在多机型、多波形、多尺度、多畸变等问题,传统的单一矢量化算法无法在波形图像分割、时间坐标构建和波形曲线采样上体现普适性的解决能力,须针对不同的数据设计不同的算法;
2)有效去除降低模型学习能力的噪声样本和冗余性计算特征,构建时间复杂度低、计算量小的矢量化模型;
3)模测震波形记录总体样本量大,具体类型样本少,须研究矢量化模型如何在大样本上体现泛化能力,在小样本上体现高精度。
同时,考虑到地震仪种类较多,不同种类的地震仪甚至同种记录仪安装于不同台站不同时期,得到的测震记录都存在较大差异,对模测震波形记录矢量化的泛化性和强鲁棒性提出了更高的要求。
发明内容
基于以上问题,围绕模测震波形矢量化中遇到的多机型、多波型、多尺度、多畸变、单一类型小样本等问题,本发明提供了一种基于深度元学习的模测震图纸矢量化方法。
实现本发明目的的技术方案是:
基于深度元学习的模测震图纸矢量化方法,包括:
(1)模测震波形记录栅格化和图像分割:对纸介测震记录图纸进行栅格化,并对得到的栅格图像进行图像分割,完成矢量化模型所需图像数据的构建;
(2)构建模测震波形记录中时间坐标系:对模测震记录中的波形进行标定时间标点,对波形时间坐标系精准建模,同时利用时间标记点模板匹配算法和自动拾取算法,屏蔽多种波形和机器类型造成的算法差异;
(3)对模测震波形进行全图纸矢量化:将图纸中的有震波形矢量后与无震波形精准拼接形成连续的波形时间序列,同时开展地震到时计算、地震沙滩球绘制、地球物理背景场分析,检出和定位有震波形,并剔除有震波形中出现的各种非震动图像噪声、平滑波、间标点等干扰信息;
(4)按图纸的噪声、畸变、有震波型、测震仪器种类建立测震图纸的小样本库,采用基于元学习技术,建立包括多种深度学习在内的波形校正和矢量化采样算法框架,构建可以针对多尺度、多类型、小样本的模测震图纸的强鲁棒深度元学习矢量化模型,并校正波形记录中存在的畸变与倾斜,使波形中走点与已建立的时间坐标点构成一一对应关系,实现有震波形强鲁棒和精准矢量的目的,同时按照国际测震数据统一格式,将上述矢量化结果标准化,达到与数字测震波形记录统一。
步骤(1)所述模测震波形记录栅格化和图像分割,是对纸介波形记录扫描后,针对不同类型、多尺度、非震噪声的模测震图纸开展图像预处理算法研究,包括:自动、快速确定扫描图纸尺寸,自动提取图纸中各项记录参数,针对多尺度的图纸设计最佳的尺寸归一化、类型分类、灰度化及图像分割算法(二值化),为后续矢量化模型提供优质的输入数据。
步骤(2)所述模测震记录中的波形由平滑波、有震波及开停机波形状构成。
步骤(2)所述模测震波形记录中时间坐标系的构建方法是:通过人工拾取起始点坐标d0(x0,y0),及时间标记点特征图,其中d0为拾取的起点,x0,y0分别为起点d0的横坐标和纵坐标;采用Faster R-CNN深度网络完成时间标记点的检出和定位,计算每个时间标记点在图纸中的位置di(xi,yi)(i=1,2,3....)(其中di为时间标记点,xi,yi为时间标记点的横纵坐标);
接着确定两个相邻时间标记点像素距离Δdi,其计算公式如下:
Δdi=di(xi,yi)-di-1(xi-1,yi-1)     (1)
计算Δdi与横轴方向整体波形长度dtotal间的比例θ,公式如下:
Figure BDA0004020275590000031
通过测震记录中上下钟时间做差,得出图纸记录时间长度ttotal,进而得到两个时间标记间时长
Figure BDA0004020275590000032
计算公式如下:
Δti=ttotal×θi       (3)
之后结合检出时间标点位置信息,推算算出图纸中所有采样位置的时间tx,继而精准完成测震图纸中时间坐标系的构建和推演:
Figure BDA0004020275590000033
步骤(3)所述有震波形包括S波、P波、L波和背景震动。
步骤(3)所述有震波形的检出,是采用多尺度分割算法进行无震背景和有震窗口分割,并按比例尺方切割训练样本,然后利用focal-loss函数优化模型损失计算过程;再通过难、易检测目标权重动态调整策略来改进目标漏检的问题。
步骤(3)所述有震波形的定位,是将多尺度分割算法作为算子嵌入到MAML元学习框架中,按照测震仪器型号、图纸尺寸大小、噪声类型等进行波形样本划分;在多类型的测震波形图纸样本空间上采样,对算子模型进行元学习,提高算子鲁棒性的同时,获取算子模型的泛化初步参数;针对某一具体类型的测震图纸样本,从元学习获得泛化参数开始,继续精化训练算子,获得有较高准确率的有震波形窗口检出模型。
步骤(3)所述有震波形窗口内平滑波、时间标点的剔除,包括有震波形窗口的选取、遍历波形曲线起点、对窗口中的扫描跟踪、提取并剔除平滑波,该剔除方法包括:
1)选择一有震波形区域,之后检测所有直线上灰度跳变点,得到图纸上n组跳变点成对坐标:{[(x0,y0),(x0,y0')],[(x1,y1),(x1,y1')],…,[(xn,yn),(xn,yn')]},则第i条波起点坐标为
Figure BDA0004020275590000034
波形宽度hi计算如下:
Figure BDA0004020275590000041
2)将窗口内的所有曲线按照检出起始点的纵坐标y值,采用希尔排序的逆序排列,继而得到起始点检测;
3)消除平滑波,以曲线i为为例,搜索方向整体水平向右,给定水平搜索步长stepx,垂直搜索步长stepy
则其水平方向下一个点xi+1搜索迭代公式如下:
xi+1=xi+stepx (i=0,1,2,…)       (6)
而对于垂直方向搜索,以stepy为步长,对波形曲线中心为轴点Ci进行上下搜索(如越界则转入复杂波搜索),获得上界yiH和下界yiL,得到跳变宽度:
hi=yiH-yiL       (7)
当跳变宽度大于线宽hi时,则转入复杂波搜索,如果横向全程都没有出现纵向跳变宽度大于线宽hi,则当成平滑波去除;
同时,在有震窗口内,采用模板法匹配法对前述提取的时间标点噪声进行模板匹配剔除。
步骤(4)所述构建模测震图纸的强鲁棒深度元学习矢量化模型,包括基于元学习的有震波形矢量化、有震波形的坐标轴校正、有震波形的绕曲校正、时间轴插值处理和构建波形时间序列,在完成的有震波形曲轴上下边界点采样后,对波形曲线中心像素坐标进行计算,获取最终的有震波形曲线采样,其算法流程包括:
1)首先检测有震波形曲线的起点和线宽,并根据线宽动态调整横向遍历步长stepx、纵向遍历步长stepy
2)接着通过对有震波形曲线上下边界从左至右、从下至上采样,确定像素跳变点对,曲线起点像素中心点C0(x0,y0)计算公式如下:
Figure BDA0004020275590000042
其中
Figure BDA0004020275590000051
为曲线起点的上下界纵坐标;
3)以步长stepx进行水平方向搜索,如采样点不为黑色则转入d步;如为黑色点,则曲线下一个采样点中心坐标Ci(xi,yi)计算如下:横坐标前进步长为stepx,纵坐标不变,得到点C'i(xi+stepx,yi),对该点上下两个方向进行搜索,检测黑色像素(即颜色跳变点),作为上界点
Figure BDA0004020275590000052
下界点
Figure BDA0004020275590000053
继而计算出新的坐标C'i(xi,yi),公式如下:
Figure BDA0004020275590000054
4)以步长stepy进行垂直方向搜索,如采样点不为黑色则转入c步,如为黑色点,则曲线下一个采样点中心坐标Ci(xi,yi)计算如下:纵坐标前进步长为stepy,横坐标不变,得到点C'i(xi,yi+stepy),对该点左右两个方向进行搜索,检测黑色像素(即颜色跳变点),作为左边界点
Figure BDA0004020275590000055
右边界点
Figure BDA0004020275590000056
继而计算出新的坐标C'i(xi,yi),公式如下:
Figure BDA0004020275590000057
5)记录上述遍历点,判断是否完成波形曲线遍历,如未完成,则向当前点的水平或垂直方向进行搜索,分别转入步骤3)或4),直至对整个窗口区域内波形完成遍历;
6)最后对上述遍历得到的数据可视化,提交由人工进行判断与修正,确保有震波形矢量化结果精确、可靠,最终形成有震波形的遍历结果。
所述有震波形的坐标轴校正和绕曲校正,包括:
通过坐标轴校正,使模测震记录坐标轴落于图纸坐标轴上,从而获得一个与水平轴垂直的坐标(Xrig,Yrig)记录,校正公式如下:
Figure BDA0004020275590000061
其中,其中R为摇臂长度,有震波形坐标轴与模测震记录图纸坐标轴夹角β以三点法通过数学计算得到;
通过上述校正,能够较为完美的解决机械因素导致的曲线圆弧形畸变所造成波形曲线上点X轴、Y轴坐标并非一一对应问题。
本发明的有益效果是:通过使用深度元学习算法,首次实现了使用单一算法架构能够较好的完成对多机型、多尺度、复杂噪声情况下对有震波形进行定位和检出,在面对现有的多种复杂图纸数据时,具有较好的鲁棒性与在多种图纸类型间都可以取得较好识别与提取效果的泛化性。通过使用多尺度图像分割技术,使现有架构能够自动、快速确定扫描图纸的尺寸,自动提取图纸中各项记录参数,针对多尺度的图纸设计最佳的尺寸归一化、类型分类、灰度化及图像分割算法(二值化),从而为后续矢量化模型提供优质的输入数据,解决了原有矢量化算法存在的目标图纸单一的问题;在此基础上,采用时间标记点模板匹配算法和自动拾取算法,自动完成对图纸中显著时间标记点的检测与标定,从而有效降低在时间坐标系构架过程中的人力消耗,进而达到提高图纸矢量化效率的目的;而基于深度元学习构建的有震波形检出算法,则将自动完成对图纸中需要着重处理的复杂波的检出,并完成对相应窗口的净化,从而为后续的有真波形矢量化工作提供良好的工作环境;最后,基于深度元学习技术的有震波形提取算法则在上述选定的有真波形区域中,完成对其中处理后波形的矢量化与矫正工作,在将全图的有震波形进行拼接,并和时间坐标系建立映射关系后,将得到数字化、可用的模测震波形数据。提取得到的数字化点集可视化后的图像将同提取时的目的图像进行对比,显而易见的,几乎在每个波形的提取中,现有的算法框架都能够较好地完成对有震波形的矢量化工作。
附图说明
图1为本发明实施例的技术实施路线图;
图2为本发明实施例的多尺度模测震图纸分割的流程图;
图3为本发明实施例时间坐标系构建方法的流程图;
图4为本发明实施例时间标记点定位与检出的技术路线图;
图5为本发明实施例面对应用中模地震波形记录图纸的说明表;
图6为本发明实施例有震波型提取框架的体系结构图;
图7为本发明实施例对提取后的波形进行矫正的流程图;
图8为本发明实施例对波形曲线起点搜索效果图;
图9为本发明实施例中有震波型矢量化算法的技术路线图;
图10为本发明实施例中有震波形边缘检测元学习框架的技术路线图;
图11为本发明实施例中有震波形曲线中心提取的流程图;
图12为本发明实施例中坐标轴偏移的简化几何示意图;
图13为本发明实施例中经矫正后的模测震波形记录;
图14为本发明实施例中波形曲线拼接示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的阐述,但不是对本发明内容的限定。
实施例:
一种基于元学习算法的模测震图纸矢量化深度学习方法,其技术实施路线图如图1所示,具体包括如下步骤:
1、模测震波形记录图像分割
模测震波形记录种类多、尺寸不一,研究的图像分割算法应具有较为强适应性,即算法应能够适应可变尺寸扫描栅格图的输入和图像分割。本专利在图像输入模块中添加尺寸自适应算法,来满足对不同尺寸图像输入的需求。
同时采用金字塔实景场解析网络(Pyramid Scene Parsing Network,)完成图像分割。该网络的核心是全局金字塔池化(Global Pyramid Pooling),其能将特征图缩放到几个不同的尺寸,使得特征具有更好地全局和多尺度信息,这一点非常适用于带有多尺度特点的模测震图像分割,并有利于其准确率的快速提升。设计的金字塔实景场解析网络图像分割示意如图2所示
具体来说:首先设计一种分层的全局先验信息,分别体现测震图纸不同尺寸及其在不同子区域之间的变化,这种先验信息可消除CNN中固定尺寸的约束;为了进一步减少不同波形子区域之间的上下文信息丢失,采用Pyramid pooling融合不同层次的特征,首先融合粗糙的全局尺度的池化特征,接着融合代表不同子区域信息的表示层;然后直接对所有的特征层作双线性插值,恢复到输入的长宽上;最后,将不同层的特征拼接起来作为金字塔池化的全局特征,最终计算出图像分割阈值。
使用上述深度学习算法预测图像分割阈值,能够针对多尺度的模测震波形图像分区域计算二值化,在不出现过合的前提下精确地将波形部分(有连续黑线)同其它背景和噪声区分,从而达成预处理中对目标图像精准分割的要求。
2、模测震波形记录时间坐标系推演
为了给每个波形采样点精准赋时,首先须人工采集记录始点,然后采用深度学习方法自动检测部分时间标记点,最后通过构建时间坐标系推演模型,完成对测震波形时间序列赋值。时间坐标系及波形时间序列构建的流程如图3所示。
具体来说,通过人工拾取起始点坐标d0(x0,y0),及时间标记点特征图,其中d0为拾取的起点,x0,y0分别为起点d0的横坐标和纵坐标;尝试采用成熟的Faster R-CNN深度网络完成时间标记点的检出和定位,计算每个时间标记点在图纸中的位置di(xi,yi)(i=1,2,3....)(其中di为时间标记点,xi,yi为时间标记点的横纵坐标)。Faster R-CNN网络主要由3个深度神经网络组成:Conv-layers Networks(卷积网络)、Region Proposal Networks(候选区域网络)、classification and regression Networks(分类与回归网络)。其中Conv-layers Networks用于时间标记点特征的学习和提取,Region Proposal Networks用于候选区域的框选,classification and regression Networks用于对时间标记点候选区域进行分类和坐标定位(精确框选),基于Faster R-CNN搭建的时间标记点定位与检出模型如图4所示。
接着确定两个相邻时间标记点像素距离Δdi,其计算公式如下:
Δdi=di(xi,yi)-di-1(xi-1,yi-1)  (1)
计算Δdi与横轴方向整体波形长度dtotal间的比例θ,公式如下:
Figure BDA0004020275590000081
通过测震记录说明表(如图5所示)中上下钟时间做差,得出图纸记录时间长度ttotal,进而得到两个时间标记间时长
Figure BDA0004020275590000082
计算公式如下:
Figure BDA0004020275590000083
之后结合检出时间标点位置信息,推算算出图纸中所有采样位置的时间tx,继而精准完成测震图纸中时间坐标系的构建和推演。
Figure BDA0004020275590000091
3、有震波形窗口(区域)选择与净化
准确检出和定位有震波形窗口(区域),并对有震波形窗口内的平滑波、时间标点等做净化处理,从而为后续有震波形的高精度、强鲁棒性识别提供高质量的训练样本,主要包括以下三部分内容:
(1)有震波形窗口的检出和定位
具体来说,本发明提出一种改进用于有震窗口检测:①其采用多尺度分割算法进行无震背景和有震窗口分割,并按比例尺方切割训练样本;②然后采用focal-loss函数优化模型损失计算过程;③最后采用难、易检测目标权重动态调整策略来改进目标漏检的问题。实验结果表明,将这种改进的EAST算法用于有震窗口检出,相比原始算法准确率提高了5.1%,时间复杂度降低了20%以上。
接着将上述算法作为算子嵌入到MAML元学习框架中,具体来说:①按照测震仪器型号、图纸尺寸大小、噪声类型等进行波形样本划分;②在多类型的测震波形图纸样本空间上采样,对算子模型进行元学习,以提高算子的鲁棒性,并获取算子模型的泛化(初步)参数;③针对某一具体类型的测震图纸样本,从元学习获得泛化参数开始,继续精化训练算子,最终获得有较高准确率的有震波形窗口检出模型。整个有震波形窗口检出和定位算法元学习框架如图7所示。
(2)有震波形窗口内平滑波、时间标点剔除
有震波形窗口内通常存在一定数量的平滑波和时间标点等干扰信息,可作为噪声剔除。
其中平滑波的剔除过程包括:有震波形窗口的选取;遍历波形曲线起点;对窗口中的平滑波扫描跟踪;提取并剔除平滑波,示意如图7所示.
具体来说,首先选择一有震波形区域,之后检测所有直线上灰度跳变点,得到图纸上n组跳变点成对坐标:{[(x0,y0),(x0,y0')],[(x1,y1),(x1,y1')],…,[(xn,yn),(xn,yn')]},则第i条波起点坐标为
Figure BDA0004020275590000092
波形宽度hi计算如下:
Figure BDA0004020275590000101
然后将窗口内的所有曲线按照检出起始点的纵坐标y值,采用希尔排序的逆序排列,继而得到起始点检测,效果如图8所示。
之后,消除平滑波。以曲线i为为例,搜索方向整体水平向右,给定水平搜索步长stepx,垂直搜索步长stepy
则其水平方向下一个点xi+1搜索迭代公式如下:
xi+1=xi+stepx (i=0,1,2,…)       (6)
而对于垂直方向搜索,以stepy为步长,对波形曲线中心为轴点Ci进行上下搜索(如越界则转入复杂波搜索),获得上界yiH和下界yiL,得到跳变宽度:
hi=yiH-yiL        (7)
当跳变宽度大于线宽hi时,则转入复杂波搜索,如果横向全程都没有出现纵向跳变宽度大于线宽hi,则当成平滑波去除。
同时,在有震窗口内,采用模板法匹配法对前述提取的时间标点噪声进行模板匹配剔除。
4、基于元学习的有震波形强鲁棒矢量化算法
这里,针对所提出的“多机型、多尺度、多类型、单一类型图纸小样本的有震波形精准矢量采样”关键科学问题,设计的技术流程有:基于元学习的有震波形矢量化;有震波形的坐标轴校正;有震波形的绕曲校正;时间轴插值处理;构建波形时间序列。技术路线示意图如图9.
一、有震波形曲线补全与跟踪采样。
针对有震波形窗口剔除平滑波并净化噪声后,有震波形曲线补全与有震波形曲线边界跟踪采样采用的算法如下:
(1)有震波形曲线补全:
模测震图纸中平滑波与有震波存在相交情况,平滑波或时间标记点剔除时可能会造成有震波被部分擦除,形成波形断点;本发明设计了交互性友好的补全程序,对净化后的有震波形断点做人工交互补全,从而形成连续的有震波形曲线,便于下一步对有震波进行精准提取。
(2)有震波形曲线边界跟踪采样:
为达到精准提取有震波的目的,须完整获取有震波曲线的边界,即曲线上灰度跳变上下界点集合。元学习框架将调整用于曲线上下边缘检测的算子模型中的超参数,使其适应多类型、多尺寸、小样本的有震波形边缘检测,得到较为准确、连续的波形曲线上下边界采样,实现强鲁棒矢量化。
总的流程是:①首先须按照图纸的有震波型(S波、P波、L波及背景震动)、测震仪器型号、尺寸大小、畸变形式等进行图纸类型标注,建立不同种类波形的相对大样本库(现有数据1.5T);②然后利用成熟的MAML元学习框架作为优化器,搭建用于曲线边缘检测的深度学习算子超参数训练平台;③接着利用训练好超参数的深度学习算子模型,针对具体类型的波形小样本库,进一步训练并精细调整模型的内部参数,预测产生波形曲线的上下边缘。整个边缘检测的元学习算法框架如图11.
具体来说,采用整体嵌套边缘检测算法(Holistically-Nested Edge Detection,HED)作为波形曲线双边缘检测的深度学习模型,其优点是:①受完全卷积神经网络的启发,可将有震波形整体作为输入,并直接产生波形双边缘图作为输出;②其采用嵌套式多尺度特征学习,这与建立的有震波形样本库存在的多尺度特征相吻合,有利于一定程度上克服模测震图纸不同尺度的影响;③同时其受deep supervision的网络启发,执行深层监督以“指导”早期分类结果,在波形边缘检测精细迭代中进一步减少了梯度损失。在预研阶段,发现利用这HED的这些特征,提取有震波形的双边缘呈现出较高的准确率以及计算效率。
(3)有震波形曲线中心确定:
在完成的有震波形曲线上下边界点采样后,应对波形曲线中心像素坐标进行计算,获取最终的有震波形曲线采样,即曲线的精准走向与变化趋势,算法流程如图11所示。
a首先检测有震波形曲线的起点和线宽,并根据线宽动态调整横向遍历步长stepx、纵向遍历步长stepy
b接着通过对有震波形曲线上下边界从左至右、从下至上采样,确定像素跳变点对,曲线起点像素中心点C0(x0,y0)计算公式如下:
Figure BDA0004020275590000121
其中
Figure BDA0004020275590000122
为曲线起点的上下界纵坐标。
c以步长stepx进行水平方向搜索,如采样点不为黑色则转入d步;如为黑色点,则曲线下一个采样点中心坐标Ci(xi,yi)计算如下:横坐标前进步长为stepx,纵坐标不变,得到点C'i(xi+stepx,yi),对该点上下两个方向进行搜索,检测黑色像素(即颜色跳变点),作为上界点
Figure BDA0004020275590000123
下界点
Figure BDA0004020275590000124
继而计算出新的坐标C'i(xi,yi),公式如下:
Figure BDA0004020275590000125
d以步长stepy进行垂直方向搜索,如采样点不为黑色则转入c步,如为黑色点,则曲线下一个采样点中心坐标Ci(xi,yi)计算如下:纵坐标前进步长为stepy,横坐标不变,得到点C'i(xi,yi+stepy),对该点左右两个方向进行搜索,检测黑色像素(即颜色跳变点),作为左边界点
Figure BDA0004020275590000126
右边界点
Figure BDA0004020275590000127
继而计算出新的坐标C'i(xi,yi),公式如下:
Figure BDA0004020275590000128
e记录上述遍历点,判断是否完成波形曲线遍历,如未完成,则向当前点的水平或垂直方向进行搜索,分别转入步骤c或d,直至对整个窗口区域内波形完成遍历。
f最后对上述遍历得到的数据可视化,提交由人工进行判断与修正,确保有震波形矢量化结果精确、可靠,最终形成有震波形的遍历结果。
二、对模测震记录矢量采样后的波形做坐标轴、曲率校正。
有震波形的校正是本实施例中的另外一个重点,直接关乎最终矢量化数据成果在后续地震到时计算、地震沙滩球校正等实际应用的有效性。
摇臂地震仪依地震大小正比产生摇臂摆动振幅的方式,带动摇臂上的记录笔将地震波形记录于图纸上,过程中可能产生圆弧而不是垂直于时间轴的挠曲。
本实施例中坐标轴偏移的简化几何示意如图12所示。摇臂记录笔与图纸的时间轴存在一个大小为β的夹角,为了将失真记录点坐标(Xdig,Ydig)转换为一系列未失真点坐标(Xcor,Ycor),本专利采用以下过程:
首先通过坐标轴校正,使模测震记录坐标轴落于图纸坐标轴上(该位置通常不完全位于X轴上),从而获得一个与水平轴垂直的坐标(Xrig,Yrig)记录。校正公式如下:
Figure BDA0004020275590000131
其中,其中R为摇臂长度。有震波形坐标轴与模测震记录图纸坐标轴夹角β以三点法通过数学计算得到。
通过上述校正,能够较为完美的解决机械因素导致的曲线圆弧形畸变所造成波形曲线上点X轴、Y轴坐标并非一一对应问题。
但仍存在问题如下:曲线迹线弯曲处有较高密度,而根据对机械式地震仪测震原理的研究可知,由于其纸张匀速运动,模测震记录在窗口内也应均匀分布于整个区间时间轴上,观测同理论矛盾,所以须要对上诉校正结果作进一步调整,使其各记录点于时间轴上均匀分布。本专利采用时间轴插值方式对数据进行处理,即对整个选定窗口按所采集坐标点个数采用一阶线性插值的方法,使采集点在整个选定区域时间长度上呈均匀分布,之后再将各调整后的坐标点相连,应用上述方法后,矫正得到的结果如图13所示。
最后,将最终经过多步校正有震波形序列附加到之前得到的时间坐标系,即将波形振幅同时间坐标系整合,从而完成对整张图纸时间序列的构建,再结合之前得到的图题相关信息,完成对模测震记录图纸的矢量化采样工作。
5、模测震波形标准化、反演和应用
模测震波形矢量化后,测震波形曲线采样矢量点以多个二维表的形式存储在数据库中,每个离散点集(二维表)代表图纸中的一条曲线,这些曲线需要拼接在一起,图14给出了波形曲线的拼接算法示意,即每条曲线的尾部和其上面紧邻的一条曲线的首部相连,以此类推。
接着按照国际测震数据统一格式(SAC)格式,进一步采样和插值及格式转换,并补全测震仪器和波形获取函数信息,进行数据的标准化,并以SAC格式发布。
然后编写波形反演(展示)SAC接口程序,实现按时间(精确到分钟)、方向,定量反演有震(P波、S波、L波、背景震动)波形,实现历史模测震数据的“智能阅读”。
最后基于SAC格式的模测震波形矢量化数据,在承德、唐山、乌鲁木齐、成都等地震台站重新开展过往大地震到时计算、地震沙滩球的绘制等工作,校正过往大地震的地震目录;进一步整合现有的数字测震数据,为地震预报、预测等研究提供更长时间范围的计算机“可读”的地球物理场背景数据;将相关的矢量化方法和模型推广应用于地下水位、地应力等模地震监测数据矢量化中。

Claims (9)

1.基于深度元学习的模测震图纸矢量化方法,其特征是:包括:
(1)模测震波形记录栅格化和图像分割:对纸介测震记录图纸进行栅格化,并对得到的栅格图像进行图像分割,完成矢量化模型所需图像数据的构建;
(2)构建模测震波形记录中时间坐标系:对模测震记录中的波形进行标定时间标点,对波形时间坐标系精准建模,同时利用时间标记点模板匹配算法和自动拾取算法,屏蔽多种波形和机器类型造成的算法差异;
(3)对模测震波形进行全图纸矢量化:将图纸中的有震波形矢量后与无震波形精准拼接形成连续的波形时间序列,同时开展地震到时计算、地震沙滩球绘制、地球物理背景场分析,检出和定位有震波形,并剔除有震波形中出现的各种非震动图像噪声、平滑波、间标点等干扰信息;
(4)按图纸的噪声、畸变、有震波型、测震仪器种类建立测震图纸的小样本库,采用基于元学习技术,建立包括多种深度学习在内的波形校正和矢量化采样算法框架,构建可以针对多尺度、多类型、小样本的模测震图纸的强鲁棒深度元学习矢量化模型,并校正波形记录中存在的畸变与倾斜,使波形中走点与已建立的时间坐标点构成一一对应关系,实现有震波形强鲁棒和精准矢量的目的,同时按照国际测震数据统一格式,将上述矢量化结果标准化,达到与数字测震波形记录统一。
2.根据权利要求1所述的模测震图纸矢量化方法,其特征是:步骤(1)所述模测震波形记录栅格化和图像分割,是对纸介波形记录扫描后,针对不同类型、多尺度、非震噪声的模测震图纸开展图像预处理算法研究,包括:自动、快速确定扫描图纸尺寸,自动提取图纸中各项记录参数,针对多尺度的图纸设计最佳的尺寸归一化、类型分类、灰度化及图像分割算法,为后续矢量化模型提供优质的输入数据。
3.根据权利要求1所述的模测震图纸矢量化方法,其特征是:步骤(2)所述模测震记录中的波形由平滑波、有震波及开停机波形状构成。
4.根据权利要求1所述的模测震图纸矢量化方法,其特征是:步骤(2)所述模测震波形记录中时间坐标系的构建方法是:通过人工拾取起始点坐标d0(x0,y0),及时间标记点特征图,其中d0为拾取的起点,x0,y0分别为起点d0的横坐标和纵坐标;采用Faster R-CNN深度网络完成时间标记点的检出和定位,计算每个时间标记点在图纸中的位置di(xi,yi)(i=1,2,3....),其中di为时间标记点,xi,yi为时间标记点的横纵坐标;
接着确定两个相邻时间标记点像素距离Δdi,其计算公式如下:
Δdi=di(xi,yi)-di-1(xi-1,yi-1)                      (1)
计算Δdi与横轴方向整体波形长度dtotal间的比例θ,公式如下:
Figure FDA0004020275580000021
通过测震记录中上下钟时间做差,得出图纸记录时间长度ttotal,进而得到两个时间标记间时长
Figure FDA0004020275580000023
计算公式如下:
Δti=ttotal×θi                             (3)
之后结合检出时间标点位置信息,推算算出图纸中所有采样位置的时间tx,继而精准完成测震图纸中时间坐标系的构建和推演:
Figure FDA0004020275580000022
5.根据权利要求1所述的模测震图纸矢量化方法,其特征是:步骤(3)所述有震波形的检出,是采用多尺度分割算法进行无震背景和有震窗口分割,并按比例尺方切割训练样本,然后利用focal-loss函数优化模型损失计算过程;再通过难、易检测目标权重动态调整策略来改进目标漏检的问题。
6.根据权利要求1所述的模测震图纸矢量化方法,其特征是:步骤(3)所述有震波形的定位,是将多尺度分割算法作为算子嵌入到MAML元学习框架中,按照测震仪器型号、图纸尺寸大小、噪声类型等进行波形样本划分;在多类型的测震波形图纸样本空间上采样,对算子模型进行元学习,提高算子鲁棒性的同时,获取算子模型的泛化初步参数;针对某一具体类型的测震图纸样本,从元学习获得泛化参数开始,继续精化训练算子,获得有较高准确率的有震波形窗口检出模型。
7.根据权利要求1所述的模测震图纸矢量化方法,其特征是:步骤(3)所述有震波形窗口内平滑波、时间标点的剔除,包括有震波形窗口的选取、遍历波形曲线起点、对窗口中的扫描跟踪、提取并剔除平滑波,该剔除方法包括:
1)选择一有震波形区域,之后检测所有直线上灰度跳变点,得到图纸上n组跳变点成对坐标:{[(x0,y0),(x0,y0')],[(x1,y1),(x1,y1')],…,[(xn,yn),(xn,yn')]},则第i条波起点坐标为
Figure FDA0004020275580000031
波形宽度hi计算如下:
Figure FDA0004020275580000032
2)将窗口内的所有曲线按照检出起始点的纵坐标y值,采用希尔排序的逆序排列,继而得到起始点检测;
3)消除平滑波,以曲线i为为例,搜索方向整体水平向右,给定水平搜索步长stepx,垂直搜索步长stepy
则其水平方向下一个点xi+1搜索迭代公式如下:
xi+1=xi+stepx(i=0,1,2,…)           (6)
而对于垂直方向搜索,以stepy为步长,对波形曲线中心为轴点Ci进行上下搜索(如越界则转入复杂波搜索),获得上界yiH和下界yiL,得到跳变宽度:
hi=yiH-yiL                 (7)
当跳变宽度大于线宽hi时,则转入复杂波搜索,如果横向全程都没有出现纵向跳变宽度大于线宽hi,则当成平滑波去除;
同时,在有震窗口内,采用模板法匹配法对前述提取的时间标点噪声进行模板匹配剔除。
8.根据权利要求1所述的模测震图纸矢量化方法,其特征是:步骤(4)所述构建模测震图纸的强鲁棒深度元学习矢量化模型,包括基于元学习的有震波形矢量化、有震波形的坐标轴校正、有震波形的绕曲校正、时间轴插值处理和构建波形时间序列,在完成的有震波形曲轴上下边界点采样后,对波形曲线中心像素坐标进行计算,获取最终的有震波形曲线采样,其算法流程包括:
1)首先检测有震波形曲线的起点和线宽,并根据线宽动态调整横向遍历步长stepx、纵向遍历步长stepy
2)接着通过对有震波形曲线上下边界从左至右、从下至上采样,确定像素跳变点对,曲线起点像素中心点C0(x0,y0)计算公式如下:
Figure FDA0004020275580000041
其中
Figure FDA0004020275580000042
为曲线起点的上下界纵坐标;
3)以步长stepx进行水平方向搜索,如采样点不为黑色则转入d步;如为黑色点,则曲线下一个采样点中心坐标Ci(xi,yi)计算如下:横坐标前进步长为stepx,纵坐标不变,得到点Ci'(xi+stepx,yi),对该点上下两个方向进行搜索,检测黑色像素(即颜色跳变点),作为上界点
Figure FDA0004020275580000043
下界点
Figure FDA0004020275580000044
继而计算出新的坐标Ci'(xi,yi),公式如下:
Figure FDA0004020275580000045
4)以步长stepy进行垂直方向搜索,如采样点不为黑色则转入c步,如为黑色点,则曲线下一个采样点中心坐标Ci(xi,yi)计算如下:纵坐标前进步长为stepy,横坐标不变,得到点Ci'(xi,yi+stepy),对该点左右两个方向进行搜索,检测黑色像素(即颜色跳变点),作为左边界点
Figure FDA0004020275580000046
右边界点
Figure FDA0004020275580000047
继而计算出新的坐标Ci'(xi,yi),公式如下:
Figure FDA0004020275580000048
5)记录上述遍历点,判断是否完成波形曲线遍历,如未完成,则向当前点的水平或垂直方向进行搜索,分别转入步骤3)或4),直至对整个窗口区域内波形完成遍历;
6)最后对上述遍历得到的数据可视化,提交由人工进行判断与修正,确保有震波形矢量化结果精确、可靠,最终形成有震波形的遍历结果。
9.根据权利要求1所述的模测震图纸矢量化方法,其特征是:所述有震波形的坐标轴校正和绕曲校正,包括:
通过坐标轴校正,使模测震记录坐标轴落于图纸坐标轴上,从而获得一个与水平轴垂直的坐标(Xrig,Yrig)记录,校正公式如下:
Figure FDA0004020275580000051
其中,其中R为摇臂长度,有震波形坐标轴与模测震记录图纸坐标轴夹角β以三点法通过数学计算得到;
通过上述校正,能够较为完美的解决机械因素导致的曲线圆弧形畸变所造成波形曲线上点X轴、Y轴坐标并非一一对应问题。
CN202211687670.6A 2022-12-27 2022-12-27 基于深度元学习的模测震图纸矢量化方法 Pending CN116051573A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211687670.6A CN116051573A (zh) 2022-12-27 2022-12-27 基于深度元学习的模测震图纸矢量化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211687670.6A CN116051573A (zh) 2022-12-27 2022-12-27 基于深度元学习的模测震图纸矢量化方法

Publications (1)

Publication Number Publication Date
CN116051573A true CN116051573A (zh) 2023-05-02

Family

ID=86115727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211687670.6A Pending CN116051573A (zh) 2022-12-27 2022-12-27 基于深度元学习的模测震图纸矢量化方法

Country Status (1)

Country Link
CN (1) CN116051573A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117475438A (zh) * 2023-10-23 2024-01-30 北京点聚信息技术有限公司 基于ocr技术的扫描文件矢量化转换方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117475438A (zh) * 2023-10-23 2024-01-30 北京点聚信息技术有限公司 基于ocr技术的扫描文件矢量化转换方法
CN117475438B (zh) * 2023-10-23 2024-05-24 北京点聚信息技术有限公司 基于ocr技术的扫描文件矢量化转换方法

Similar Documents

Publication Publication Date Title
CN107807387B (zh) 基于神经网络的地震初至波走时获取方法
CN109100741A (zh) 一种基于3d激光雷达及图像数据的目标检测方法
US20060122780A1 (en) Method and apparatus for seismic feature extraction
US10073190B2 (en) Method and system for geophysical modeling of subsurface volumes based on computed vectors
CN111626993A (zh) 一种基于嵌入式FEFnet网络的图像自动检测计数方法及系统
WO2004008389A1 (en) Pattern recognition applied to oil exploration and production
EP2880470A2 (en) Hybrid method of combining multipoint statistic and object-based methods for creating reservoir property models
CN110208859A (zh) 基于超声成像的油基泥浆井裂缝定量参数智能计算方法
CN111414954B (zh) 一种岩石图像检索方法及其系统
CN105259570A (zh) 一种海上时移地震接收点位移校正方法
CN115187803B (zh) 一种用于名优茶嫩芽采摘过程的定位方法
CN111381275A (zh) 一种地震数据的初至拾取方法和装置
CN116051573A (zh) 基于深度元学习的模测震图纸矢量化方法
CN101551467A (zh) 一种基于边界检测的初至波自动拾取方法
CN112784980A (zh) 一种智能化测井层位划分方法
CN114863258B (zh) 海天线场景中基于视角转换检测小目标的方法
CN115308803A (zh) 煤层厚度预测方法、装置、设备和介质
Zhang et al. SaltISCG: Interactive salt segmentation method based on CNN and graph cut
CN113532424B (zh) 一种获取多维信息的一体化设备与协同测量方法
CN117351371A (zh) 一种基于深度学习的遥感图像目标检测方法
CN117593601A (zh) 一种基于深度学习的水尺验潮方法
CN109387872B (zh) 表面多次波预测方法
CN112819813B (zh) 一种地下管线智能识别方法、装置及存储介质
CN112183473B (zh) 一种地质曲面视觉语义特征提取方法
CN117152083B (zh) 一种基于类别激活映射的探地雷达道路病害图像预测可视化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination