CN111597677A - 一种测震图像的矢量化方法、装置、设备及存储介质 - Google Patents
一种测震图像的矢量化方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111597677A CN111597677A CN202010252094.7A CN202010252094A CN111597677A CN 111597677 A CN111597677 A CN 111597677A CN 202010252094 A CN202010252094 A CN 202010252094A CN 111597677 A CN111597677 A CN 111597677A
- Authority
- CN
- China
- Prior art keywords
- seismic
- waveform
- image
- curve data
- simulated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明实施例提供一种测震图像的矢量化方法、装置、设备及存储介质。该方法包括:获取模拟测震图纸中包括测震波形的测震图像;对测震图像进行预处理,并经校验后保存至数据库;基于波形平衡场分析的提取算法,从测震图像中的测震波形中提取出矢量化的强振动波型及强振动波型对应的时间信息;基于时间信息按时间轴对强振动波型进行拼接,得到矢量化的波形曲线数据;基于可视化算法,对波形曲线数据进行可视化处理,输出波形曲线数据对应的波形曲线,实现了对纸质模拟测震图纸信息进行数据化处理与存储、矢量化处理,最终得到有震波形可视化结果,很好地提供了准确的模拟测震图像数据化、矢量化的体验。
Description
技术领域
本发明涉及图像处理的技术领域,尤其涉及一种测震图像的矢量化方法、装置、设备及存储介质。
背景技术
在模拟测震领域,无数先辈工作者利用有限的条件记录下了许多宝贵的数据与资料,但受限于技术,其主要呈现形式又以纸质图像为主,直至新世纪的到来,才有部分数字化地震数据可供参考。纸质模拟测震数据由于其年代久远,存在地震波形变形、污渍或者由于时间导致纸张老化、脆弱,存在难以较为直接、科学、细致的对其进行准确的研究的缺陷。
而针对地震记录文件,目前还没有比较系统的方案能够对现有的大量地震记录进行系统、精确地处理,普遍都是依靠人力借助部分实体工具对现有的有限数据进行比对与研究,也没有一个产品对模拟测震记录进行有效的格栅化处理并将其中强振动部分矢量化记录,无法全面、系统、科学的完成从现有纸质数据到矢量化数字化的清晰、尺度精确数据的全部处理过程。
因此,需要提出一种高效、准确的地震记录矢量化方法,解决上述问题。
发明内容
本发明实施例提供一种测震图像的矢量化方法、装置、设备及存储介质,用以解决现有技术中纸质模拟测震数据由于其年代久远,存在地震波形变形、污渍或者由于时间导致纸张老化、脆弱,难以较为直接、科学、细致的对其进行准确的研究的缺陷。
第一方面,本发明实施例提供一种测震图像的矢量化方法,包括:
获取模拟测震图纸中包括测震波形的测震图像;
对所述测震图像进行预处理,并经校验后保存至数据库;
基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
基于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;
基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
可选的,所述获取模拟测震图纸中包括测震波形的测震图像,具体包括:
对模拟测震图纸进行扫描,得到数字化的测震图像;
获取所述模拟测震图纸的图纸信息;
按预置规则对扫描得到的所述测震图像进行命名;
将所述测震图像与所述图纸信息关联储存于数据库。
可选的,所述对所述测震图像进行预处理,并经校验后保存至数据库,具体包括:
对扫描得到的所述测震图像进行图像压缩;
对经图像压缩后的所述测震图像进行二值化处理,输出经二值化后的所述测震图像;
对经二值化后的所述测震图像,按照预置标准进行命名;
对所述测震图像的文件名按照文件命名校验规则、非法字符校验规则和录入时间校验规则三种不同校验规则进行校验;
将校验成功的所述测震图像存储于数据库。
可选的,所述基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出矢量化的强振动波型及所述强振动波型对应的时间信息,具体包括:
对所述测震图像进行包括起末点搜索、波形判断、弱振动波型擦除的初步处理;
获取波形平衡场分析的提取算法;
基于所述提取算法从擦除弱振动波后的结果中提取出矢量化的模拟测震记录,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
对所述模拟测震记录进行唯一性和准确性的校对,并将校对成功的所述模拟测震记录保存至数据库。
可选的,所述基于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据,具体包括:
从矢量化的所述模拟测震记录中获取二维表形式的矢量点集;
确定预置的时间标记点;
基于所述时间标记点从所述矢量点集中提取出数据矢量及时间戳;
对所述离散的数据矢量依据所述时间戳进行拼接,得到连续的、矢量化的波形曲线数据。
可选的,所述基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线,具体包括:
确定预置的选定范围;
获取所述选定范围内的波形曲线数据;
基于改进的K-medoids聚类算法,从所述选定范围内的波形曲线数据中提取出强振动波形对应的波形曲线数据片段。
对所述波形曲线数据片段进行定量拟合,得到强振动波形对应的波形曲线。
可选的,在所述基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线之后,还包括:
将数据库中的数据信息实时异步复制到预置数量的备份数据库中,并相互校验;
将向所述可视化算法提供的所述波形曲线数据,以矢量点集的形式储存成txt文档,并保存至数据库;
将所述可视化算法处理得到的波形曲线进行展示。
第二方面,本发明实施例提供一种测震图像的矢量化装置,该装置包括:
测震图像获取模块,用于获取模拟测震图纸中包括测震波形的测震图像;
预处理模块,用于对所述测震图像进行预处理,并经校验后保存至数据库;
模拟测震记录提取模块,用于基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
拼接模块,用于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;
可视化模块,用于基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面任一项所述测震图像的矢量化方法。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面任一项所述测震图像的矢量化方法。
本发明实施例提供的测震图像的矢量化方法、装置、设备及存储介质,通过应用基于波形平衡场分析算法,辅以图像处理、人工智能处理的一系列算法,针对纸质的模拟测震图纸进行扫描、压缩、二值化,之后进行数字化处理、矢量化处理,并最终通过K-medoids聚类算法等人工智能处理的算法提取出其中的强振动波形区域,全面、系统、科学的完成从现有纸质数据到矢量化数字化的清晰、尺度精确数据的全部处理过程,很好地提供了模拟测震图纸数字化、矢量化的体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种模拟测震图像的矢量化方法的流程图;
图2为本发明实施例提供的一种模拟测震图像预处理方法的流程图;
图3为本发明实施例提供的一种模拟测震图像中波形记录提取方法的流程图;
图4为本发明实施例提供的一种波形记录拼接方法的流程图;
图5为本发明实施例提供的一种波形曲线可视化处理方法的流程图;
图6为本发明实施例的一种模拟测震图像矢量化过程中数据库处理的示意图;
图7为本发明实施例提供的模拟测震图像矢量化过程中数据库各分量的示意图;
图8为本发明实施例提供的一种模拟测震图像矢量化装置的结构示意图;
图9为本发明实施例提供的电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中纸质模拟测震记录数据由于其年代久远,存在地震波形变形、污渍或者由于时间导致纸张老化、脆弱,难以较为直接、科学、细致的对其进行准确的研究的缺陷。
具体的,可以通过获取模拟测震图纸中包括测震波形的测震图像;对所述测震图像进行预处理,并经校验后保存至数据库;基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;基于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
图1为本发明实施例提供的一种测震图像的矢量化方法的流程图,如图1所示,包括:
S1、获取模拟测震图纸中包括测震波形的测震图像;
S2、对所述测震图像进行预处理,并经校验后保存至数据库;
S3、基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
S4、基于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;
S5、基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
具体地,步骤S1中,首先获取一定数量的纸质版的、在模拟测震过程中所记录的测震图像,组成图像集合;该测震图像中记录了测震波形,该测震波形可以包括强振动波形和弱振动波形等。
本实现方式中,可以基于大数据平台,对图像集合中的测震图像进行预处理,并经校验后,将结果保存至数据库中,该数据库可以是非关系型数据库;
在一种可能的实现方式中,可以引入波形平衡场分析的提取算法,对格栅化处理后的测震图像进行提取、分析,以得到模拟测震记录,该模拟测震记录至少包括矢量化的强振动波型及该强振动波型对应的时间信息。再基于对模拟测震记录的拼接算法,基于强振动波型对应的时间信息对上述提取的强振动波形按时间轴进行拼接还原,得到拼接好的、矢量化的波形曲线数据;基于可视化算法,对上述结果进行可视化,输出可视化操作结果,即该波形曲线数据对应的波形曲线。
本发明实施例通过应用基于波形平衡场算法辅以图像处理、人工智能处理的一系列算法,针对纸质的模拟测震图纸进行扫描、压缩、二值化,之后进行数字化处理、矢量化处理,并最终通过K-medoids聚类算法等人工智能处理的算法提取出其中的强振动波形区域,全面、系统、科学的完成从现有纸质数据到矢量化数字化的清晰、尺度精确数据的全部处理过程,很好地提供了模拟测震图纸数字化、矢量化的体验。
基于上述实施例,步骤S1可以具体包括:
对模拟测震图纸进行扫描,得到数字化的测震图像;
获取所述模拟测震图纸的图纸信息;
按预置规则对扫描得到的所述测震图像进行命名;
将所述测震图像与所述图纸信息关联储存于数据库。
将纸质模拟测震记录图纸进行扫描,得到数字化模拟测震记录图纸信息;
将纸质模拟测震记录图纸上相关信息进行提取,并按一定规则对扫描得到的模拟测震图纸信息进行命名,得到的相关信息储存至非关联型数据库。
其中,图纸信息包括原始图像录入相关信息、原始图像图纸图像信息、原始图像图纸标记信息等。
具体地,可以对纸质的模拟测震图纸进行扫描,以得到数字化的测震图像。本系统原则上采取由专人操作,一次扫描进而得到需要数据,尽可能防止在操作过程中致使宝贵资料收到损害。
在扫描中,我们可以通过使用公式,对影响图像质量的参数(如分辨率,位深度,压缩比等参数)进行均衡处理,使得扫描得到测震图像为最清晰的结果。
在储存时,储存关系表中的一条记录和一套(3个栅格影像,分别对应于3个方向)地震波形一一对应,即1张原始纸质的模拟测震图纸对应1条数据库记录和3张不同方向的测震图像。
而在对扫描得到的文件可以是依据预置的规则进行命名,该规则可以是以[台站代码+“_”+仪器型号+“_”+记录开始时间(格式:年月日时分)+方向(UD、NS、EW)]的方式进行命名。通过命名规则的确定,可以在一定程度上有利于保证图纸信息的唯一性;。
基于上述任一实施例,图2为本发明实施例提供的一种模拟测震图像预处理方法的流程图,参照图2,步骤S2所涉及到的模拟测震图像预处理方法,可以具体包括:
对扫描得到的所述测震图像进行图像压缩;
对经图像压缩后的所述测震图像进行二值化处理,输出经二值化后的所述测震图像;
对经二值化后的所述测震图像,按照预置标准进行命名,进而保证图像的唯一性;
对所述测震图像的文件名按照文件命名校验规则、非法字符校验规则和录入时间校验规则三种不同校验规则进行校验,从而保证输入数据库的图纸确实可靠,避免人为向数据库中导入错误数据;
将校验成功的所述测震图像存储于数据库。
在一具体的实施例中,针对扫描的得到存储空间占用大的图像集合,可以开发对原始的模拟测震图纸的素材集合进行处理的相关程序模块,该模块可以有效地将素材集合中原有占空间大的测震图像有效无损压缩。进一步的,本发明实施例可以使用了PNG格式来完成对扫描的得到的高存储空间占用结果进行压缩。选用PNG格式进行压缩的优点在于,其进行图像压缩的结果是获得较高的压缩比,却不损失数据信息的结果,同时由于其采用的8通道色彩标识模式,和扫描结果的色彩表示模式相似,可以最大可能的保证压缩后结果数据完整,并且能够与各种其他处理方式完美对接。上述优势有利于后续对不同比例尺的模拟测震数据进行有针对性地处理,输出对应的处理结果。
进一步的,在对测震图像进行二值化处理时,一般有如下方法:最大类间差、最大熵、最小误差和最小偏差。通过实际应用中处理效果的对比,优选的,本实施例的二值化算法可以采取最大类间差算法。具体的,一般的,最大间差法和最小误差法处理结果较为理想,而由于最小误差法的计算复杂度较高,所以此处选用最大类间差算法来完成模拟测震记录的二值化。
一般对数据正确性要求较高的检验中采用的是双工校验法,但此种方法工作繁琐,且存在可能对本实施例中涉及的模拟测震图纸造成严重损害的缺陷,难以接受。本发明实施例中对录入信息的校验采取文件名、非法字符、与录入时间三重校验规则。其中,对文件名的校验,即检验文件名唯一性,如有重名情况则提示校验员进行确认并重新输入,直至无重复文件名为止;对非法字符的校验则是对输入中可能存在的错误进行检查,按照相关规范,对输入系统模块的数据进行比对,不符合者无法录入数据库,保证输入的标准可靠;录入时间校验分为系统初校验与人工精校验两种,其中系统初校验主要保证数据记录按时间顺序线性记录,而人工精校验则主要比对模拟测震记录头信息中的记录时间,校正录入的时间信息。
本发明实施例通过对获得的素材集合中的测震图像进行压缩、校验与二值化,便于后续基于波形平衡场的强振动波形提取时,更加针对有效的进行图像处理模型建立,进而更准确地进行对模拟测震数据中强振动波形的定位、分离、提取。
基于上述任一实施例,图3为本发明实施例提供的一种模拟测震图像中波形记录提取方法的流程图,参照图3,步骤S3所涉及到的模拟测震图像中记录波形提取方法,具体包括:
对所述测震图像进行包括起末点搜索、波形判断、弱振动波型擦除的初步处理;
获取波形平衡场分析的提取算法;
基于所述提取算法从擦除弱振动波后的结果中提取出矢量化的模拟测震记录,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
对所述模拟测震记录进行唯一性和准确性的校对,并将校对成功的所述模拟测震记录保存至数据库。
在本实施例中,图像的提取、识别可以采用的是OpenCV算法,OpenCV是一种BSD许可(开源)发行的跨平台计算机视觉库,在现在较为常用的系统上有较高的兼容性,是一种轻量级的软件开发包,由一系列C函数和少量C++类构成,接近机器底层代码,非常的高效,能够精确的完成对地震波形轮廓的跟踪、表达和解释功能,同时辅以优秀的演示参数调整功能。
具体地,该技术体系对测震图像的时间起、末点进行搜索、对整个格栅化的测震图像中波形种类(弱振动、强振动)进行判断、通过弱振动波形提取算法,追踪并擦除记录中的弱振动波形,最后将使用波形平衡场分析的提取算法从擦除弱振动波后的结果中提取其中的强振动波形,并以矢量点集的形式保存至非关系型数据库。
具体来讲,首先依照图3,在进行包括起末点的搜索时,可以按像素遍历测震图像全图,以得到各行数据的起始点。具体的,可以通过从测震图像左上角坐标位置垂直向下搜索所有测震波形。如,在出现像素值跳变时提取纵坐标,从而得到测震图像中测震波形各行的起始坐标与线宽,之后再按照各行起始点坐标进行排序得到每行所包含的点集与测震波形所有行的游程(这里游程特指图纸上两根测震曲线之间的的高度),并算出相邻曲线间平均游程。
进一步的,本实施例中,在进行波形判断时,可以是通过对上述得到的各行游程与平均游程数据的比值进行判断,如当比值小于1时,则确定该波形为弱振动波,否则为强振动波,从而完成对测震波形的识别。在完成上述操作后,可以对得到的弱振动波进行提取,得到测震图像中关于弱振动波形的集合,并将其擦除,为之后强振动波形的提取做出准备。本实施例的强振动波提取采用基于波形平衡场分析的提取算法。波形平衡场算法是一种针对曲线波形提取设计的算法,能够很好地适应模拟测震记录图纸的波形特征,准确的找到其中的关键点,并进行相关分析,从而得到较为准确的结果。
在本实施例中,依照图3,波形平衡场分析算法通过追踪曲线波的黑色像素点,找到强振动波的像素颜色跳变边界,计算其一定邻域范围内的黑色像素点个数,并和平衡点的黑色像素个数进行对比,从而追踪波形曲线的走势趋向,进而将离散的点集变为整条曲线,并将最终的结果提取并输出,得到复杂曲线波形。
可以理解的是,经过对测震图像一系列的预处理,并剔除其中的弱振动波,之后采用波形平衡场分析算法对上述得到的结果进行提取处理,得到强振动波形,有利于之后的进一步处理与最终结果的输出。
可以利用输出的结果可以绘制地震沙滩球,和地震目录中的地震描述进行直接比较,如果相差在指定范围内,如地震能量(1个数量级内),可以认为矢量化结果较为可靠。最为精度检测的一种手段。
基于上述任一实施例,图4为本发明实施例提供的一种有震波形记录拼接方法的流程图,参照图4,步骤S4所涉及到的有震波形记录拼接方法,具体包括:
从矢量化的所述模拟测震记录中获取二维表形式的矢量点集;
确定预置的时间标记点;
基于所述时间标记点从所述矢量点集中提取出数据矢量及时间戳;
对所述离散的数据矢量依据所述时间戳进行拼接,得到连续的、矢量化的波形曲线数据。
需要说明的是,若直接按照模拟测震图纸中的标识进行拼接,具有误差较大,容易受到曲线矢量化和曲线波形干扰的缺点。因此,本实施例采用基于时间标记点的拼接算法,可以人工选取预置的时间标记点,之后再拼接其所在曲线,最终得到拼接后的波形曲线数据。
基于上述任一实施例,图5为本发明实施例提供的一种波形曲线可视化处理方法的流程图,参照图5,步骤S5所涉及到的波形曲线可视化处理子方法,具体包括:
确定预置的选定范围;
获取所述选定范围内的波形曲线数据;
基于改进的K-medoids聚类算法,从所述选定范围内的波形曲线数据中提取出强振动波形对应的波形曲线数据片段。
对所述波形曲线数据片段进行定量拟合,得到强振动波形对应的波形曲线。
具体地,建立可视化算法,获取基于波形定量的可视化算法,在之前拼接好的整个波形曲线数据的基础上,对上述提取的强振动波形进行可视化运算,输出更加清晰、连贯、且具有科研意义的地震波形记录数据,并同步储存至非关联型数据库进行保存。
其中,进行可视化的区域选取可以通过人工输入一定的范围,作为预置的选定范围,而后使用冒泡算法从数据库的时间序列中找到对应矢量点,计算其准确的横坐标值,并提取出来,为下一步的曲线拟合做好准备;
本实施例中针对波形曲线矢量的曲线拟合算法预设了三种,可以由训练好的算法模块根据曲线波形数据的不同而自动选取,进而完成曲线拟合操作。
具体的,预设的三种曲线拟合算法分别为:基于最小二乘法的分段直线拟合、基于贝塞尔曲线的曲线拟合、基于三次样条插值的曲线拟合。
其中,基于最小二乘法的拟合主要应用于地震波形中折线较短和直线较长部分,通过训练与计算,得到拟合子集经验值点数,从而在上述部分取得较好拟合结果;基于贝塞尔曲线的拟合则适用于有震部分,由于此部分提取关键点较稀疏,故实际应用时采取多次拟合的方法,拟合出长段的波形曲线;基于三次样条插值的拟合则主要应用于对上述两种拟合的优化,通过一系列相关计算,能够有效减少拟合中涉及的参数,从而提高程序效率。
进一步的,本发明实施例中,还创新地使用基于聚类分析的强振动波形智能识别算法,对拼接得到的波形曲线数据中强振动波形进行智能化的识别,解决准确从图像中提取强振动波形数据的技术难题。
聚类,一种将物理或抽象个体组成的集合对象分为多个类的过程,聚类分析则是一种研究分类问题的统计学方法,但与分类不同,聚类的划分是未知的。在本实施例中,程序将通过比较模式相似性完成对相关信息的聚类,此处提及的相似性可大致分为以下三种:距离测度、相似测度和匹配测度。每种测度各有4-6种不同的测量方法,程序中,将通过算法调用相关的计算公式,完成对上述模拟测震记录的聚类分析。
目前有多种算法能够完成聚类分析操作,本实施例中采用的是基于经典划分算法的K-medoids算法的改进算法。K-medoids算法将接受k个参数,并从导入的数据中选出k个作为聚类核,剩下的数据根据同聚类核的相似度,划分为k类,并提取同一聚类中和所有点距离最小的点为聚类中心点,不断重复上述过程,使测度函数收敛,从而得到同聚类相似度高,不同聚类相似度低的结果。本实施例中对K-medoids算法进行了改进,根据数据的特点,将k设定为三(弱振动、强振动、弱振动),对应振动波形图像的三个特征区段,并且只保留有两个相邻类的聚类(只有一个相邻类的归入其相邻类),从而加强了算法针对曲线数据的处理能力,优化了算法的时间复杂度,并辅以强振动形分段模块,将强振动形分为多个小的时间序列,并行处理,提高了波形智能化识别的速度与整个程序的效率。
基于上述任一实施例,在所述基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线,还包括:
将数据库中的数据信息实时异步复制到预置数量(如10个)的备份数据库中,并相互校验;
将向所述可视化算法提供的所述波形曲线数据,以矢量点集的形式储存成txt文档,并保存至数据库;
将所述可视化算法处理得到的波形曲线进行展示。
其中,向所述可视化算法提供的所述波形曲线数据可以是向检索模块输入预置的选定范围,并通过检索模块找到匹配的强振动波型的矢量点集进行拼接得到的波形曲线数据。
进一步的,检索模块返回选定范围对应的测震图像、选定范围内的模拟测震记录,并经过可视化模块进行可视化,展现至界面,从而便于专家快速定位地震时间及其震动波形,便利之后进一步的研究。
具体地,图6为本发明实施例的一种模拟测震图像矢量化过程中数据库处理的示意图,如图6中所示,首先提取矢量化的波形曲线数据中时间点为标签,同时从数据库中提取时间点对应的模拟测震图纸的图纸信息,本发明实施例采用的是MongoDB数据库,该数据库会实时同步数据至强振动形检索引擎,强振动形检索引擎返回包括搜索时间点、时间点所在的模拟测震图纸、时间点对应的测震波形等一系列检索结果给用户,进行检索结果的展示。
图7为本发明实施例提供的模拟测震图像矢量化过程中数据库中各分量的示意图,展示了测震图像矢量化方法中所使用的数据库中的各分量的信息。
此处,MongoDB数据库是一个基于分布式的,开源的,应用于文档数据信息存储的非关系型数据库,在所有非关系型数据库中拥有最丰富功能,同时和关系型数据库极其相似。MongoDB在C++编程环境下编写,其目的在于处理巨量数据时能够提供较高的可靠性与过程稳定性。
本发明实施例通过用户提供的纸质历史模拟测震图纸,经过一些列的处理,并进行基于波形能量的波形平衡场分析算法进行强振动波形提取,并最终由可视化模块进行输出与展示。实践证明,通过构建本系统,能够大大的减轻对纸质模拟测震记录图纸的分析与研究速度,提供更加精准、客观有效的地质科学研究数据及相关记录,从而有效的以现代化手段利用历史积存地震数据,大大丰富了相关领域研究的数据记录,为地学研究提供了方便。
基于上述任一实施例,本发明实施例采用的软硬件处理环境为:
CPU:Intel(R)Core(TM)i7-9700K 3.60GHz;内存:64GB(DDR4);显卡:NVIDIATesla P4024GB;硬盘:320GB。软件环境操作系统为Windows 10,开发语言采用C#语言,能够高效快速的处理所需数据。开发平台采用vs2015,vs2015使用基于面向对象的软件开发方法,模块化程度高,程序模块可重用性好,同时,vs2015含有大量的C#相关算法包,支持2D、3D渲染及OpenGL算法和XML格式数据导入,可以免于单独引用的复杂流程,并能有效地完成对本系统所需数据的导入及处理。本实施例在上述环境基础上,引入OpenCV3.0作为扩展开发选型,在完美的适应用户对本系统提出的各种合理需求及相关的二次开发扩展需要的同时,尽最大可能兼容用户现有设备。
图8为本发明实施例提供的一种模拟测震图像矢量化装置的结构示意图,如图8所示,包括:测震图像获取模块81、预处理模块82、模拟测震记录提取模块83、拼接模块84、可视化模块85。
测震图像获取模块81,用于获取模拟测震图纸中包括测震波形的测震图像;
预处理模块82,用于对所述测震图像进行预处理,并经校验后保存至数据库;
模拟测震记录提取模块83,用于基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
拼接模块84,用于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;
可视化模块85,用于基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
本发明实施例提供基于波形平衡场算法的模拟测震图像矢量化构建方法及系统,通过应用基于波形平衡场算法,辅以图像处理、人工智能处理的一系列算法,针对纸质的模拟测震图纸进行扫描、压缩、二值化,之后进行数字化处理、矢量化处理,并最终通过K-Medoids聚类算法等人工智能处理的算法提取出其中的强振动波形区域,全面、系统、科学的完成从现有纸质数据到矢量化数字化的清晰、尺度精确数据的全部处理过程,很好地提供了模拟测震图纸数字化、矢量化的体验。
基于上述任意实施例,该装置还可以包括文件加载模块、橡皮擦模块等。
其中,文件加载模块用于原始图像素材的获取,既可从数据库(MongoDB)中提取导入的二进制图像,也可以直接从文件夹中加载图像;橡皮擦模块用于对自然保存地质图像中的污渍、人工标注等进行擦除,输出清洁、易于后续处理的地震加测数据信息。
基于上述任意实施例,所述测震图像获取模块81,可以具体用于:
对模拟测震图纸进行扫描,得到数字化的测震图像;
获取所述模拟测震图纸的图纸信息;
按预置规则对扫描得到的所述测震图像进行命名;
将所述测震图像与所述图纸信息关联储存于数据库。
基于上述任意实施例,预处理模块82,可以具体用于:
对扫描得到的所述测震图像进行图像压缩;
对经图像压缩后的所述测震图像进行二值化处理,输出经二值化后的所述测震图像;
对经二值化后的所述测震图像,按照预置标准进行命名;
对所述测震图像的文件名按照文件命名校验规则、非法字符校验规则和录入时间校验规则三种不同校验规则进行校验;
将校验成功的所述测震图像存储于数据库。
基于上述任一实施例,模拟测震记录提取模块83,可以具体用于:
对所述测震图像进行包括起末点搜索、波形判断、弱振动波型擦除的初步处理;
获取波形平衡场分析的提取算法;
基于所述提取算法从擦除弱振动波后的结果中提取出矢量化的模拟测震记录,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
对所述模拟测震记录进行唯一性和准确性的校对,并将校对成功的所述模拟测震记录保存至数据库。
基于上述任一实施例,拼接模块84,可以具体用于:
从矢量化的所述模拟测震记录中获取二维表形式的矢量点集;
确定预置的时间标记点;
基于所述时间标记点从所述矢量点集中提取出数据矢量及时间戳;
对所述离散的数据矢量依据所述时间戳进行拼接,得到连续的、矢量化的波形曲线数据。
基于上述任一实施例,可视化模块85,可以具体用于:
确定预置的选定范围;
获取所述选定范围内的波形曲线数据;
基于改进的K-medoids聚类算法,从所述选定范围内的波形曲线数据中提取出强振动波形对应的波形曲线数据片段。
对所述波形曲线数据片段进行定量拟合,得到强振动波形对应的波形曲线。
基于上述任一实施例,该装置还可以包括:
备份模块,用于将数据库中的数据信息实时异步复制到预置数量的备份数据库中,并相互校验;
波形曲线数据存储模块,用于将向所述可视化算法提供的所述波形曲线数据,以矢量点集的形式储存成txt文档,并保存至数据库;
展示模块,用于将所述可视化算法处理得到的波形曲线进行展示。
发明实施例提供的系统用于执行上述对应的方法,其具体的实施方式与方法的实施方式一致,涉及算法流程与对应方法算法流程近似,不再于此处赘述。
图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:存储器(memory)910、通信接口(Communications Interface)920、处理器(processor)930和通信总线940,其中,通信接口920,处理器930,存储器910通过通信总线940完成相互间的通信。处理器930可以调用存储器910中的逻辑指令,以执行如下方法:获取模拟测震图纸中包括测震波形的测震图像;对所述测震图像进行预处理,并经校验后保存至数据库;基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;基于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
此外,上述的存储器910中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:存储器(memory)910、通信接口(Communications Interface)920、处理器(processor)930和通信总线940,其中,通信接口920,处理器930,存储器910通过通信总线940完成相互间的通信。处理器930可以调用存储器910中的逻辑指令,以执行如下方法:
获取模拟测震图纸中包括测震波形的测震图像;
对所述测震图像进行预处理,并经校验后保存至数据库;
基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
基于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;
基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种测震图像的矢量化方法,其特征在于,包括:
获取模拟测震图纸中包括测震波形的测震图像;
对所述测震图像进行预处理,并经校验后保存至数据库;
基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
基于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;
基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
2.根据权利要求1所述的测震图像的矢量化方法,其特征在于,所述获取模拟测震图纸中包括测震波形的测震图像,具体包括:
对模拟测震图纸进行扫描,得到数字化的测震图像;
获取所述模拟测震图纸的图纸信息;
按预置规则对扫描得到的所述测震图像进行命名;
将所述测震图像与所述图纸信息关联储存于数据库。
3.根据权利要求1所述的测震图像的矢量化方法,其特征在于,所述对所述测震图像进行预处理,并经校验后保存至数据库,具体包括:
对扫描得到的所述测震图像进行图像压缩;
对经图像压缩后的所述测震图像进行二值化处理,输出经二值化后的所述测震图像;
对经二值化后的所述测震图像,按照预置标准进行命名;
对所述测震图像的文件名按照文件命名校验规则、非法字符校验规则和录入时间校验规则三种不同校验规则进行校验;
将校验成功的所述测震图像存储于数据库。
4.根据权利要求1所述的测震图像的矢量化方法,其特征在于,所述基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出矢量化的强振动波型及所述强振动波型对应的时间信息,具体包括:
对所述测震图像进行包括起末点搜索、波形判断、弱振动波型擦除的初步处理;
获取波形平衡场分析的提取算法;
基于所述提取算法从擦除弱振动波后的结果中提取出矢量化的模拟测震记录,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
对所述模拟测震记录进行唯一性和准确性的校对,并将校对成功的所述模拟测震记录保存至数据库。
5.根据权利要求1所述的测震图像的矢量化方法,其特征在于,所述基于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据,具体包括:
从矢量化的所述模拟测震记录中获取二维表形式的矢量点集;
确定预置的时间标记点;
基于所述时间标记点从所述矢量点集中提取出数据矢量及时间戳;
对所述离散的数据矢量依据所述时间戳进行拼接,得到连续的、矢量化的波形曲线数据。
6.根据权利要求1所述的测震图像的矢量化方法,其特征在于,所述基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线,具体包括:
确定预置的选定范围;
获取所述选定范围内的波形曲线数据;
基于改进的K-medoids聚类算法,从所述选定范围内的波形曲线数据中提取出强振动波形对应的波形曲线数据片段;
对所述波形曲线数据片段进行定量拟合,得到强振动波形对应的波形曲线。
7.根据权利要求1至6任一权利要求所述的测震图像的矢量化方法,其特征在于,在所述基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线之后,还包括:
将数据库中的数据信息实时异步复制到预置数量的备份数据库中,并相互校验;
将向所述可视化算法提供的所述波形曲线数据,以矢量点集的形式储存成txt文档,并保存至数据库;
将所述可视化算法处理得到的波形曲线进行展示。
8.一种测震图像的矢量化装置,其特征在于,包括:
测震图像获取模块,用于获取模拟测震图纸中包括测震波形的测震图像;
预处理模块,用于对所述测震图像进行预处理,并经校验后保存至数据库;
模拟测震记录提取模块,用于基于波形平衡场分析的提取算法,从所述测震图像中的测震波形中提取出模拟测震记录,并经校对后保存至数据库,所述模拟测震记录至少包括矢量化的强振动波型及所述强振动波型对应的时间信息;
拼接模块,用于所述时间信息按时间轴对所述强振动波型进行拼接,得到矢量化的波形曲线数据;
可视化模块,用于基于可视化算法,对所述波形曲线数据进行可视化处理,输出所述波形曲线数据对应的波形曲线。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述测震图像的矢量化方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述测震图像的矢量化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010252094.7A CN111597677A (zh) | 2020-04-01 | 2020-04-01 | 一种测震图像的矢量化方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010252094.7A CN111597677A (zh) | 2020-04-01 | 2020-04-01 | 一种测震图像的矢量化方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111597677A true CN111597677A (zh) | 2020-08-28 |
Family
ID=72185428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010252094.7A Pending CN111597677A (zh) | 2020-04-01 | 2020-04-01 | 一种测震图像的矢量化方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111597677A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307086A (zh) * | 2020-10-30 | 2021-02-02 | 湖北烽火平安智能消防科技有限公司 | 一种消防业务中自动化数据校验方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017071438A1 (zh) * | 2015-10-28 | 2017-05-04 | 中国石油天然气股份有限公司 | 全向矢量地震数据处理方法、装置、计算机可读存储介质及设备 |
CN108509495A (zh) * | 2018-02-14 | 2018-09-07 | 中国地震台网中心 | 地震数据的处理方法及装置、存储介质、处理器 |
CN109490948A (zh) * | 2018-11-16 | 2019-03-19 | 西南石油大学 | 地震声学波动方程矢量并行计算方法 |
-
2020
- 2020-04-01 CN CN202010252094.7A patent/CN111597677A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017071438A1 (zh) * | 2015-10-28 | 2017-05-04 | 中国石油天然气股份有限公司 | 全向矢量地震数据处理方法、装置、计算机可读存储介质及设备 |
CN108509495A (zh) * | 2018-02-14 | 2018-09-07 | 中国地震台网中心 | 地震数据的处理方法及装置、存储介质、处理器 |
CN109490948A (zh) * | 2018-11-16 | 2019-03-19 | 西南石油大学 | 地震声学波动方程矢量并行计算方法 |
Non-Patent Citations (3)
Title |
---|
史鹏飞: "基于 OpenCV 的模拟地震记录矢量化算法设计与软件开发" * |
史鹏飞;张翔;丰继林;王茂发;韩定良;: "基于OpenCV的模拟地震记录矢量化软件" * |
易天阳;王双洪;马伶俐;李菲菲;王伟力;: "地震监测模拟记录图纸数字化" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307086A (zh) * | 2020-10-30 | 2021-02-02 | 湖北烽火平安智能消防科技有限公司 | 一种消防业务中自动化数据校验方法及装置 |
CN112307086B (zh) * | 2020-10-30 | 2024-05-24 | 湖北烽火平安智能消防科技有限公司 | 一种消防业务中自动化数据校验方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104299260B (zh) | 一种基于sift和lbp的点云配准的接触网三维重建方法 | |
CN110211048A (zh) | 一种基于卷积神经网络的复杂档案图像倾斜矫正方法 | |
US10311635B2 (en) | Method and apparatus for detecting repetitive structures in 3D mesh models | |
CN109726746A (zh) | 一种模板匹配的方法及装置 | |
Brown et al. | Handprinted symbol recognition system | |
CN101241004A (zh) | 形状误差分析系统及方法 | |
CN107832849B (zh) | 一种基于知识库的电力线廊道三维信息提取方法及装置 | |
CN115170749B (zh) | 基于Cesium的WEBGIS三维可视化构建方法及系统 | |
CN113360587B (zh) | 一种基于gis技术的土地测绘设备及测绘方法 | |
Fisseler et al. | Extending Philological Research with Methods of 3D Computer Graphics Applied to Analysis of Cultural Heritage. | |
CN109298450A (zh) | 地震采集观测系统属性分析方法及装置 | |
CN110490153B (zh) | 一种基于三维动态特征的离线笔迹个体识别系统及方法 | |
CN111626358A (zh) | 一种基于bim图片识别的隧道围岩分级方法 | |
CN111597677A (zh) | 一种测震图像的矢量化方法、装置、设备及存储介质 | |
CN117115569B (zh) | 基于机器学习的物像自动识别分类方法及系统 | |
Liu et al. | Automatic fracture segmentation and detection from image logging using mask R-CNN | |
CN112288856B (zh) | 一种三维碎片拼接重构方法、系统、设备及存储介质 | |
CN112233104A (zh) | 实时位移场和应变场检测方法、系统、装置和存储介质 | |
CN114493291B (zh) | 一种高填方质量智能检测方法及系统 | |
CN115588178A (zh) | 一种高精地图要素自动化提取的方法 | |
CN116412759A (zh) | 一种利用三维激光扫描仪进行林业调查的方法 | |
Kıvılcım et al. | Parametric Architectural Elements from Point Clouds for HBIM Applications | |
Frischknecht et al. | A raster-based approach for the automatic interpretation of topographic maps | |
Ding et al. | Knowledge-based automatic extraction of multi-structured light stripes | |
Hodgson et al. | A parameterization model for transportation feature extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |