CN109581502B - 地震勘探数据压缩方法、装置以及压缩存储结构 - Google Patents

地震勘探数据压缩方法、装置以及压缩存储结构 Download PDF

Info

Publication number
CN109581502B
CN109581502B CN201811256396.0A CN201811256396A CN109581502B CN 109581502 B CN109581502 B CN 109581502B CN 201811256396 A CN201811256396 A CN 201811256396A CN 109581502 B CN109581502 B CN 109581502B
Authority
CN
China
Prior art keywords
data
sampling point
integer
seismic
point data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811256396.0A
Other languages
English (en)
Other versions
CN109581502A (zh
Inventor
岩巍
马立新
夏颖
罗福龙
刘晓明
黄磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Petroleum Corp
BGP Inc
Original Assignee
China National Petroleum Corp
BGP Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China National Petroleum Corp, BGP Inc filed Critical China National Petroleum Corp
Priority to CN201811256396.0A priority Critical patent/CN109581502B/zh
Publication of CN109581502A publication Critical patent/CN109581502A/zh
Application granted granted Critical
Publication of CN109581502B publication Critical patent/CN109581502B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/32Transforming one recording into another or one representation into another

Landscapes

  • Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Environmental & Geological Engineering (AREA)
  • Geology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Geophysics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明提供了一种地震勘探数据压缩方法、装置以及压缩存储结构,该地震勘探数据压缩方法包括:根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;将每个地震道数据块中的多个整数样点数据顺序分组;每组整数样点数据中,将第一个整数样点数据转换为预设位长的二进制数据,将其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数。该方法利用样点数据与其前一样点数据的差值表示该样点数据,将差值按预设位数进行存储,在不影响地震勘探数据质量的前提下,能够减少数据存储位数,有效减少地震道数据块所占用的存储空间。

Description

地震勘探数据压缩方法、装置以及压缩存储结构
技术领域
本发明涉及石油勘探数据处理领域,尤其涉及一种地震勘探数据压缩方法、装置、压缩存储结构、计算机设备以及计算机可读存储介质。
背景技术
在地球物理勘探开发生产中,所有地震勘探数据都需要依照一定格式存储于存储介质中,以便于现场进行质量控制以及后期处理、解释等工序。按照仪器类型不同,存储的过程也存在一定差异,如有线、无线仪器的全部数据依照位流的形式从采集设备汇总至地震勘探仪器主机,现场实时生成地震勘探原始数据,并进行质量控制,依照生产安排的周期上交进行处理、解释;节点仪器的数据在生产过程中实时将连续数据(激发和待命时期内的全部数据)存储在设备自身的存储器中,完成激发采集工序后,全部节点设备回收至数据下载设备中再将全部数据下载,在根据主机记录中的激发时间将连续数据进行分离,合成为上交需要的地震勘探原始数据。
目前通用的地震数据存储格式为32位浮点数据,即每个地震勘探数据的数据样点占32个二进制位。数据存储根据具体格式规定又分为Seg-Y和Seg-D两种,分别使用32位IBM浮点格式和32位IEEE浮点格式,两种32位格式都是使用1位标识正负,分别使用7位或8位作为阶数,24位或23位作为有效数字的定长度表示一个样点。
在地震勘探生产中,由于地震数据采集道数多、采集时长长、炮数多,因此地震勘探数据的存储量巨大,如国内常规的震源三维生产参数为6万道采集、7秒记录长度、1ms采样间隔、项目生产每日5000炮左右,每天的地震勘探数据量就达到约7TB。地震勘探生产根据施工要求多需要进行2-3份最终备份,再加上仪器内存储、数据上交临时存储设备、现场处理存储设备、最终处理存储设备、存档存储设备,数据需要5-6份的存储,由此带来巨大的存储成本支出。
发明内容
本发明提供一种地震勘探数据压缩方法和装置、压缩存储结构、计算机设备以及计算机可读存储介质,依照地震勘探数据特点对地震勘探数据进行高保真压缩,在不影响地震勘探数据质量的前提下,能够减少地震勘探数据的存储量,进而减少地震勘探生产过程中,尤其是使用节点仪器生产带来的巨大的存储成本支出。
为实现上述效果,本发明采用如下技术方案:
第一方面,提供一种地震勘探数据压缩方法,该地震勘探数据包括:文件头段、炮头段以及多个地震道数据块,每个地震道数据块包括:道头段以及多个样点数据,该地震勘探数据压缩方法包括:
根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;
将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数。
进一步地,该地震勘探数据压缩方法还包括:将每组整数样点数据中的第一个整数样点数据转换为预设位长的二进制数据。
进一步地,该地震勘探数据压缩方法还包括:将每组整数样点数据中的第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输。
进一步地,将每个地震道数据块中的多个整数样点数据分为N组,包括:
将每个地震道数据块中的多个整数样点数据平均分为N组。
进一步地,将每个地震道数据块中的多个整数样点数据分为N组,包括:
将每个整数样点数据与其前一整数样点数据的差值转换为二进制数据;
将二进制数据的位数相差预设范围的整数样点数据分为一组。
进一步地,该地震勘探数据压缩方法还包括:
在每个地震道数据块的道头段之后,插入压缩参数字段。
进一步地,压缩参数字段包括:样点数据单位、压缩单位、分组方式、预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长。
进一步地,根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,包括:
根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声;
根据等效输入噪声,选取一比例因数,其中,比例因数小于等于等效输入噪声,大于地震勘探仪器系统能够分辨的最小输入电压;
将样点数据除以比例因数之后,进行四舍五入取整。
进一步地,该地震勘探数据压缩方法还包括:
去除第一地震道数据块之后的地震道数据块的道头段中与第一地震道数据块的道头段相比相同的数据。
进一步地,该地震勘探数据压缩方法还包括:
随机读取任一组内第一样点至第M样点对应的M个二进制数据,M小于等于组内样点的总数;
将M个二进制数据转换为M个整数数据;
将M个整数数据相加,得到第M样点对应的整数样点数据;
将整数样点数据乘以比例因数,得到解压后的数据;
计算第M样点的实际样点数据与解压后的数据的误差值;
判断误差值是否大于预设阈值;
若是,发出报警指令。
进一步地,该地震勘探数据压缩方法还包括:
随机读取任一组内第一样点至第M样点对应的M个数据,M小于等于组内样点的总数;
将M个数据中的二进制数据分别转换为整数数据;
将整数数据乘以比例因子,得到对应的解压数据;
将经过上述处理的M个数据相加,得到第M样点对应的理论解压样点数据;
计算第M样点的实际样点数据与理论解压样点数据的误差值;
判断误差值是否大于预设阈值;
若是,发出报警指令。
第二方面,提供一种地震勘探数据压缩装置,地震勘探数据包括:文件头段、炮头段以及多个地震道数据块,每个地震道数据块包括:道头段以及多个样点数据,地震勘探数据压缩装置包括:
取整模块,用于根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;
分组模块,用于将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
第一数据压缩模块,将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数。
进一步地,该地震勘探数据压缩装置还包括:
第二数据压缩模块,将每组整数样点数据中的第一个整数样点数据转换为预设位长的二进制数据。
进一步地,该地震勘探数据压缩装置还包括:
数据存储模块,将每组整数样点数据中的第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输。
进一步地,分组模块用于将每个地震道数据块中的多个整数样点数据平均分为N组。
进一步地,分组模块包括:
数据转换单元,用于将每个整数样点数据与其前一整数样点数据的差值转换为二进制数据;
数据分组单元,用于将二进制数据的位数相差预设范围的整数样点数据分为一组。
进一步地,该地震勘探数据压缩装置还包括:
压缩参数插入模块,用于在每个地震道数据块的道头段之后,插入压缩参数字段。
进一步地,压缩参数字段包括:样点数据单位、压缩单位、分组方式、预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长。
进一步地,取整模块包括:
噪声识别单元,用于根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声;
比例因数选取单元,用于根据等效输入噪声,选取一比例因数,其中,比例因数小于等于等效输入噪声,大于地震勘探仪器系统能够分辨的最小输入电压;
数据取整单元,用于将样点数据除以比例因数之后,进行四舍五入取整。
进一步地,该地震勘探数据压缩装置还包括:
道头压缩模块,用于去除第一地震道数据块之后的地震道数据块的道头段中与第一地震道数据块的道头段相比相同的数据。
进一步地,该地震勘探数据压缩装置还包括:
校验数据读取模块,用于随机读取任一组内第一样点至第M样点对应的M个二进制数据,M小于等于组内样点的总数;
校验数据转换模块,用于将M个二进制数据转换为M个整数数据;
校验数据解压模块,用于将M个整数数据相加,得到第M样点对应的整数样点数据;
校验数据还原模块,用于将整数样点数据乘以比例因数,得到解压后的数据;
压缩误差计算模块,用于计算第M样点的实际样点数据与解压后的数据的误差值;
压缩精度判断模块,用于判断误差值是否大于预设阈值;
压缩失真报警模块,用于在误差值大于预设阈值时发出报警指令。
进一步地,该地震勘探数据压缩装置还包括:
校验数据读取模块,用于随机读取任一组内第一样点至第M样点对应的M个数据,M小于等于组内样点的总数;
校验数据转换模块,用于将M个数据中的二进制数据转换为整数数据;
校验数据解压模块,用于将整数数据乘以比例因子,得到对应的解压数据;
校验数据还原模块,用于将经过上述处理的M个数据相加,得到第M样点对应的理论解压样点数据;
校验误差计算模块,用于计算第M样点的实际样点数据与理论解压样点数据的误差值;
压缩精度判断模块,用于判断误差值是否大于预设阈值;
压缩失真报警模块,用于在误差值大于预设阈值时发出报警指令。
第三方面,提供一种地震勘探数据的压缩存储结构,包括:文件头段、炮头段以及多个地震道数据块,每个地震道数据块包括:道头段、压缩参数字段以及N组数据,每组数据包括:
第一个样点数据,或者,对第一整数样点数据进行二进制转换得到的预设位长的二进制数据,其中,对第一样点数据进行取整得到第一整数样点数据;
对多个差值进行二进制转换得到的多个位长为P的二进制数据,其中,差值由组数据中除第一样点数据之外的其余样点数据取整后的整数样点数据与其前一样点数据取整后的整数样点数据相减得到。
第四方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;
将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数。
第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;
将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数。
本发明提供的地震勘探数据压缩方法、装置、压缩存储结构、计算机设备以及计算机可读存储介质,充分考虑地震勘探仪器系统的噪声级别,利用样点数据与其前一样点数据的差值表示该样点数据,将差值按预设位数进行存储,在不影响地震勘探数据质量的前提下,能够减少数据存储位数,有效减少地震道数据块所占用的存储空间,进而减少存储成本支出。
另外,本发明提供的地震勘探数据压缩方法可以直接在地震勘探数据产生的同时进行数据压缩,即对数据流进行压缩存储,适于具有一定逻辑运算功能的实时传输采集系统。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中地震勘探数据以Seg-Y存储结构;
图2为地震勘探信号的波形图;
图3为本发明实施例的地震勘探数据压缩方法的流程图一;
图4为本发明实施例的地震勘探数据压缩方法的流程图二;
图5为本发明实施例的地震勘探数据压缩方法的流程图三;
图6为采用本发明实施例中压缩后的地震数据存储结构的示意图;
图7示出了图3中步骤S301的具体实施步骤的流程图;
图8示出了图3中步骤S302的具体实施步骤的流程图;
图9示出本发明实施例采用非定长分组获得的示例性数据存储结构;
图10示出本发明实施例采用定长分组获得的示例性数据存储结构;
图11示出了本发明实施例中对压缩进行校验报警的步骤的流程图;
图12为本发明另一实施例的地震勘探数据压缩方法的流程图一;
图13为本发明另一实施例的地震勘探数据压缩方法的流程图二;
图14为本发明另一实施例的地震勘探数据压缩方法的流程图三;
图15为采用本发明另一实施例中压缩后的地震数据存储结构的示意图;
图16示出本发明另一实施例采用非定长分组获得的示例性数据存储结构;
图17示出本发明另一实施例采用定长分组获得的示例性数据存储结构;
图18示出了本发明另一实施例中对压缩进行校验报警的步骤的流程图;
图19为本发明实施例的地震勘探数据压缩装置的结构示意图一;
图20为本发明实施例的地震勘探数据压缩装置的结构示意图二;
图21为本发明实施例的地震勘探数据压缩装置的结构示意图三;
图22为本发明实施例的地震勘探数据压缩装置的结构示意图四;
图23为本发明实施例的地震勘探数据压缩装置的结构示意图五。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
值得说明的是,在地震勘探项目中,每一个地震道数据块是指在同一检波点(也称观测点)所采集的数据包,多个地震道数据块是在多个检波点所采集的多个数据包。另外,一个地震道数据块中的若干个样点数据是指在同一个检波点间隔一定时间进行采样时,在多个采样时间点所采集到的数据。
图1为现有技术中地震勘探数据以Seg-Y存储结构。Seg-Y是目前地震勘探中最常用的数据存储形式。如图1所示,一份Seg-Y数据文件通常包括文件头段、炮头段以及地震道数据三大部分,该地震道数据分为若干个地震道数据块(分别记为第1道~第S道),每一个地震道数据块又包括一个道头段以及若干个样点数据(分别记为样点1~样点Z)。
其中,该文件头段一般为3200比特,该炮头段一般为400比特,该道头段一般为240比特。
每个样点数据都是一个32位浮点数据,存储时均占32个二进制位。其中,使用1个二进制位标识正负,使用8个二进制位作为阶数,使用23个二进制位作为有效数字的定长度表示一个样点。
在地震勘探项目中,因为地震数据采集道数多、采集时长长、炮数多,所以样点数据众多,若按照现有技术中的数据存储方式,每个样点数据存储时均占32个二进制位,则样点数据的存储量巨大,如国内常规的震源三维生产参数为6万道采集、7秒记录长度、1ms采样间隔、项目生产每日5000炮左右,每天的数据量就达到约7TB,中东某项目招标已要求进行11.52万道采集,项目跨度5-6年,若按照现有技术中的数据存储方式,可以预见,项目中的存储成本支出巨大。
另外,目前地震勘探设备市场正在推广节点化仪器,节点化仪器的地面设备间不进行数据交换,全部设备都在同一GPS授时下连续采集,即不论是否有激发源激发都进行采集,勘探项目一般都为24小时连续施工,因此在项目施工结束时,节点化仪器下载的数据量为同等施工条件下有线仪器的2-3倍,所需要的存储空间更多。
由此可以看出,目前地震勘探领域迫切需要一种地震数据压缩方法,解决地震数据存储量大、存储成本高的问题。
为解决现有技术中存在的上述问题,本发明实施例提供了一种地震勘探数据压缩方法、装置以及压缩存储结构,依照地震勘探数据特点对地震勘探数据进行高保真压缩,在不影响地震勘探数据质量的前提下,能够减少地震勘探数据的存储量,进而减少地震勘探生产过程中,尤其是使用节点仪器生产带来的巨大的存储成本支出。
首先通过对多个地震勘探项目中的大量地震勘探信号进行对比研究,发现地震勘探信号的特点在于:
1、当有激发源进行激发时,震源能量传输至该地震道的短时间内,地震勘探仪器系统所采集到的信号的能量和频率都较高,随着时间推移,采集到的信号的能量衰减较快、变化值较小。
2、震源能量传输至该地震道之前,地震勘探仪器系统所采集到的信号的能量较弱、变化值较小。
3、使用节点化仪器进行地震数据勘探时,在无激发源进行激发时,节点化仪器采集到的信号的能量较弱、变化值较小。
通过分析可知,地震勘探仪器系统所采集的信号经历以下三个阶段,如图2所示:
阶段1(记为激发前):在0时刻至激发初至到达的时间为激发能量到达地震勘探仪器系统之前的时段,地震勘探仪器系统采集到的样点数据都是噪音,其变动幅度和绝对数值都较小。
阶段2(记为激发时):在激发初至到达后一段时间内为激发能量到达地震勘探仪器系统的时段(时长由距离激发点的距离和激发能量大小决定),地表振动较剧烈,地震勘探仪器系统采集到的样点数据的真值变动幅度较大,绝对数值也较高,为高频高幅度。其中,受限于地震勘探仪器系统最大输入信号的限制,样点数据的真值不会超过最大输入信号范围,离激发点越近的地震道,能量越强,阶段2持续的时间越长。
阶段3(记为激发后):在激发初至到达后一段时间之后的时间为激发能量经过地震勘探仪器系统一段时间之后的时段,地表振动逐渐减小,地震勘探仪器系统采集到的样点数据的真值变动幅度逐渐减小,绝对数值较高,但变动幅度逐渐变小,为低频高幅度。最终能量完全消散,恢复至阶段1的状态。
由此可见,地震勘探信号仅在阶段2出现巨大变动,阶段1和阶段3都属于较小变动的状态,尤其对于节点仪器,采集时还存在大量的非激发时间(没有震源激发时也进行采集)。
利用地震勘探信号的上述特性,本发明提供了一种地震勘探数据压缩方法,如图3所示,该地震勘探数据压缩方法包括:
步骤S301:根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据。
其中,将样点数据进行取整时,考虑到地震勘探仪器系统在上述三个阶段所采集到的样点数据都包含噪音,该噪音包括:外部环境噪音以及地震勘探仪器系统的等效输入噪声(即地震勘探仪器系统的内部噪音,也称热噪声)。当没有激发能量时,若样点数据的真值小于地震勘探仪器系统的等效输入噪声时,该样点数据为无效数据(也可称为坏数据),应当剔除。另外,由于不同地震勘探仪器系统所处的环境不同,其外部环境噪音也不同,因此不能对外部环境噪音进行统一量化去除,但是地震勘探仪器系统的等效输入噪声为固定值,可以统一量化去除,所以本发明实施例在对样点数据进行压缩之前,先根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,以便最大限度消除无效数据以及地震勘探仪器系统的等效输入噪声的影响,实现样点数据筛选和去燥,减少后续处理的数据体量,以节省存储空间并提高数据精度。
可以理解的是,由于受限于仪器最大输入信号限制,因此样点数据的真值的变动差值不会大于2倍最大输入信号。
步骤S302:将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
值得说明的是,在对多个整数样点数据分组时,每个组中的整数样点数据是连续的一串样点数据,即顺序相邻的采样点的数据,另外,根据不同地震勘探项目的需求,分组时可以选用定长分组方法以及非定长分组方法,两种分组方法将在下文中详细描述。
步骤S303:将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数,其中,位长P为绝对值最大的差值对应的二进制数据位数。
本实施例提供的地震勘探数据压缩方法,充分考虑了地震勘探仪器系统的等效输入噪声,对样点数据进行整型化处理,然后,利用整数样点数据与其前一整数样点数据的差值表示该样点数据,差值的存储位长为绝对值最大的差值对应的二进制数据位数,以保证所有差值都能进行有效存储的前提下,最大限度减小差值存储所需位长。
通过采用上述方法,将数值较大的采样数据转换为数值较小的差值进行存储,并对差值的存储位长进行优化,能够在不影响地震勘探数据质量的前提下,减少数据存储位数,有效减少地震道数据块所占用的存储空间,进而减少存储成本支出。
图4为本发明实施例的地震勘探数据压缩方法的流程图二。如图4所示,该地震勘探数据压缩方法在包含上述图3所示的步骤的基础上,还可以包括:
步骤S400:将每组整数样点数据中的第一个整数样点数据转换为预设位长的二进制数据。
值得说明的是,通过对整数样点数据进行分组,每组整数样点数据中,可以将第一个整数样点数据转换为预设位长的二进制数据(即实际数据)进行单独存储,作为数据解压时该组整数样点数据的基础计算点,使不同分组对应各自的基础计算点,可以有效避免压缩时的累计误差,同时可将该第一个整数样点数据作为上一组整数样点数据最后一个整数样点数据的对比控制点。
其中,第一个整数样点数据转换为二进制数据进行存储时的预设位长可以根据需要进行选取,对于某一地震勘探项目,可以选择将所有分组的第一个整数样点数据均采用相同的预设位长a,比如32;当然,也可以将不同分组的第一个整数样点数据根据其数值大小自由选取。
在一个可选的实施例中,还可以将第一个整数样点数据按照浮点格式进行存储或传输,位长可采用预设位长,也可以根据将第一个整数样点数据的数值大小自由选取。
步骤S401:在每个地震道数据块的道头段之后,插入压缩参数字段,该压缩参数字段用于描述对应的地震道数据块中的样点数据的压缩相关信息。
值得说明的是,该方法对各步骤的先后顺序不作限制。图示仅为该方法的一种示例,不应理解为对各步骤的先后顺序的限制。
具体地,该压缩参数字段至少包括:样点数据单位、压缩单位、分组方式、预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长等信息,在此基础上,还可以包括:对数据进行取整时所采用的比例因数、对压缩数据进行校验时需要的校验参数,下面结合表1对压缩参数字段所包含的信息进行详细说明。
表1:压缩参数字段
Figure BDA0001842814840000121
值得说明的是,地震勘探采集原始数据单位依照仪器类型不同分为V和G两种,常见使用mV、mG、nV、nG。
在上述表1中,该压缩样点数据单位1字段表示该地震勘探采集原始数据单位,若取值为0,则代表该地震勘探采集原始数据单位为V,若取值为1,则代表该地震勘探采集原始数据单位为G,该压缩样点数据单位1字段的存储位长为1个二进制位。
该压缩样点数据单位2字段表示该地震勘探采集原始数据单位的具体量级,取值可设为1/10V、1/100V、mV、1/10mV、1/100mV、μ/、1/100m、1/100mV、nV、1/10nV、1/100nV中的一个,或者由用户自定义数值,该压缩样点数据单位2字段的存储位长为4个二进制位。
该比例因数字段是指在步骤S301中对数据进行取整时采用的参数,其取值大于仪器能分辨的最小输入电压,小于等于等效输入噪声。下文中会对其进行详细说明,该比例因数字段的存储位长为32个二进制位。
该是否定长压缩字段代表步骤S302中对整数样点数据进行分组时所采用的分组方法,若取值为0,则代表对整数样点数据进行分组时采用的是定长分组方法,若取值为1,则代表对整数样点数据进行分组时采用的是非定长分组方法,该是否定长压缩字段的存储位长为3个二进制位。
该基础点间隔字段代表对压缩数据进行校验时采用的校验参数,参数值在0~1023之间,该基础点间隔字段的存储位长为10个二进制位。
具体地,在进行数据压缩时,尤其针对非定长压缩而言,为防止某一组样点数据中样点数据的个数过多时受累计误差影响导致数据失真,还可以设置基础样点,基础样点就是不压缩的原始数据,是32位的IEEE规则的未压缩样点数据,基础样点间隔是指预定义的基础样点之间的间隔,即间隔一定数量个样点数据而设置一个基础样点,实现强制间隔一定数量个样点数据而回归一个原始样点数据,其意义主要用于校验数据,防止数据失真。
举例来说,如果非定长压缩分组时某一组数据过长,比如直接超过了一个跑记录长度,如6秒,整个数据就相当于失去了校验点,而通过间隔一定数量个样点数据而设置一个基础样点,利用基础样点记录该样点的原始数据(即通过基础点间隔体现),有效阻隔了累计误差的传播。
其中,该是否定长压缩字段的取值为0,对整数样点数据进行分组时采用定长分组方法时,压缩参数字段包括的分组信息具体为:总样点数、每组样点数、第一组原样点、第一组位长、第二组原样点、第二组位长、……第R组原样点、第R组位长,其中,R代表组数,R=总样点数÷每组样点数,当总样点数不能被每组样点数整除时,R向上取整。
具体地,该总样点数字段表示对应的地震道数据块所含样点数据的总个数,取值在0~4294967295之间,该总样点数字段的存储位长为32个二进制位。
该每组样点数字段表示每组样点数据中的样点数据个数,取值在0~4294967295之间,该每组样点数字段的存储位长为32个二进制位。
该第一组原样点~第R组原样点代表对应组样点数据中第一个样点数据整型化之后的数值的二进制格式,存储位长为32位。当然,本领域技术人员能够理解的是,该第一组原样点~第R组原样点也可以根据其数值大小,选取对应的存储位长,只需保证所选的存储位长能够容纳对应样点数据即可。
该第一组位长~第R组位长分别表示对应组样点数据中除第一个样点数据之外的其他数据的存储位长,其取值在0~31之间,存储位长为5个二进制位。
另外,该是否定长压缩字段的取值为1,对整数样点数据进行分组时采用非定长分组方法时,压缩参数字段包括的分组信息具体为:压缩组数、第一组样点数、第一组原样点、第一组位长、第二组样点数、第二组原样点、第二组位长……第K组样点数、第K组原样点、第K组位长,其中,K代表组数。
具体地,该压缩组数字段表示对应的地震道数据块所含样点数据组的组数K,取值在0~4294967295之间,存储位长为32个二进制位。
该第一组样点数至第K组样点数表示对应组样点数据中的样点数据的总个数,取值在0~1023之间,存储位长为10个二进制位。
该第一组原样点至第K组原样点表示对应组样点数据中第一个样点数据整型化之后的数值的二进制格式,存储位长为32位。当然,本领域技术人员能够理解的是,该第一组原样点~第R组原样点也可以根据其数值大小,选取对应的存储位长,只需保证所选的存储位长能够容纳对应样点数据即可。
该第一组位长至第K组位长表示对应组样点数据中除第一个样点数据之外的其他数据的存储位长,其取值在0~31之间,存储位长为5个二进制位。
图5为本发明实施例的地震勘探数据压缩方法的流程图三;如图5所示,该地震勘探数据压缩方法在包含上述图4所示的步骤的基础上,还可以包括:
步骤S501:去除第一地震道数据块之后的地震道数据块的道头段中与第一地震道数据块的道头段相比相同的数据。
值得说明的是,对于步骤501,其可以在样点数据压缩之前进行,也可以在样点数据压缩之后进行,该方法对各步骤的先后顺序不作限制。图示仅为该方法的一种示例,不应理解为对各步骤的先后顺序的限制。
具体地,道头段一般包括:是否压缩头段、是否压缩数据、线号、桩号以及采样率、增益等参数段的起止地址和数据内容等。
举例来说,某一地震勘探项目中,某一地震道数据块的道头段与前一地震道数据块的道头段相比,只有线号桩号以及设备状态信息不同,通过本发明实施例提供的方法,使第一地震道数据块的道头段记载上述全部信息,第一地震道数据块之后的地震道数据块的道头段仅记载线号桩号以及设备状态信息,实现道头段数据压缩,进一步减少存储所需空间,进而减少存储成本。
图6为采用本发明实施例中压缩后的地震数据存储结构的示意图。如图6所示,该地震数据存储结构包括:文件头段、炮头段以及地震道数据三大部分,该地震道数据分为若干个地震道数据块(分别记为第1道~第S道),每一个地震道数据块又包括一个道头段、压缩参数字段以及若干个样点(分别记为样点1~样点Z)。
其中,该文件头段一般为3200比特,该炮头段一般为400比特。
第1道的道头段一般为240比特。第2道至第S道的道头段因为一般仅记载线号桩号以及设备状态信息,所以小于240比特。
以该第1道为例,对地震道数据块的存储结构进行详细说明。
其中,该压缩参数字段至少包括:样点数据单位、压缩单位、分组方式、预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长、对数据进行取整时所采用的比例因数、对压缩数据进行校验时需要的校验参数等。
该样点1字段所存储的数值为将第1个样点数据取整后的整数样点数据对应的二进制值,其存储位长为预设位长,该预设位长一般可根据需要选择采用32个二进制位,或小于32个二进制位。
该差值2字段所存储的数值为将第2个样点对应的整数样点数据减去第1个样点对应的整数样点数据所得的差值对应的二进制值。
该差值3字段所存储的数值为将第3个样点对应的整数样点数据减去第2个样点对应的整数样点数据所得的差值对应的二进制值,依此类推。
该差值Z字段所存储的数值为将第Z个样点对应的整数样点数据减去第Z-1个样点对应的整数样点数据所得的差值对应的二进制值。
其中,差值2至差值Z的存储位长P为差值2至差值Z中绝对值最大的差值所对应的二进制值的位数,其中,符号位占一位。
其中,上述地震数据存储结构相当于没有对样点数据进行分组时的存储结构,即分组数N=1。这种不对样点数据进行分组的方式能够有效压缩数据,减小数据所需的存储空间,但是,有可能会出现累计误差,使得数据容易失真。其中,可以通过对数据进行分组的方式来有效防止累计误差导致数据容易失真的问题,后文中将对数据分组的方式进行详细叙述,在此不再赘述。
图7示出了步骤S301的具体实施步骤的流程图;如图7所示,步骤S301包括:
步骤S701:根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声。
其中,仪器型号、增益以及等效输入噪声的对应关系是在仪器出厂时便固定的,仪器型号、增益以及等效输入噪声的对应关系表由厂家提供,将仪器型号、增益以及等效输入噪声的对应关系表输入至控制器中,控制器通过读取文件头段中的仪器型号和增益信息,在对应关系表中查找对应的地震勘探仪器系统的等效输入噪声。
依照前放增益不同,目前常见的地震勘探仪器系统的噪声水平普遍在0.79mV至0.09mV之间,部分仪器型号、增益以及等效输入噪声的对应关系表如表2所示:
表2:仪器型号、增益以及等效输入噪声的对应关系表
Figure BDA0001842814840000161
Figure BDA0001842814840000171
其中,举例来说,若地震勘探项目采用的仪器型号为Hawk、增益为24dB,则对应的等效输入噪声为0.1。
步骤S702:根据等效输入噪声,选取一比例因数,其中,比例因数小于等于等效输入噪声,大于地震数据勘探时采样的最小单位。
其中,结合上述举例,若地震勘探仪器系统的等效输入噪声为0.1μ.,则选取的比例因数小于等于0.1μ.即可,另外,一般地震勘探项目采用的仪器能够分辨的最小输入电压大于0.1nV,所以,比例因数应大于地震勘探项目采用的仪器能够分辨的最小输入电压,即比例因数大于0.1nV。若比例因数小于0.1nV,由于仪器只能分辨到0.1nV,相当于采集到的数据最小位为0.1nV,所以,若比例因数小于0.1nV,则会在取整时将样点数据扩大过多倍数,影响数据压缩效率。
另外,在选择比例因数时,还可以考虑数据采集需求,如:若作为地震勘探采集现场处理数据,需要最大程度考虑数据的有效性,此时,可将比例因数取值为1nV或0.1nV(1nG或0.1nG),当采集数据的需求为用于现场质量控制时,则仅需考虑地震道的噪音水平、能量、频率等属性,可以将比例因数取值为10nV或0.1mV(10nG或0.1mG)。
步骤S703:将样点数据除以比例因数之后,进行四舍五入取整。
其中,通过将样点数据除以比例因数,将数据扩大,使得能够在将噪声去除的基础上,最大限度保证样点实际真值,防止数据失真。
通过上述取整方法,能够实现在消除无效数据以及地震勘探仪器系统的等效输入噪声的影响的前提下,使去除的数据小于该等效输入噪声,防止数据失真,保证数据无损压缩。
图8示出了步骤S302的具体实施步骤的流程图;该流程图示出了对整数样点数据进行非定长分组的方法。如图8所示,步骤S302包括:
步骤S801:将每个整数样点数据与其前一整数样点数据的差值转换为二进制数据;
步骤S802:将二进制数据的位数相差预设范围的整数样点数据分为一组。
举例来说,若将差值转换为二进制数据之后,二进制数据的位数(包含符号位)为8、8、8、8、9、9、9、10、11、11、11、10、10、10、9、9、9、9、9……,若将位数相差2位的整数样点数据分为一组,则从第一个差值开始,将全部连续位数在8-10位之间的数据分为一组,即[8、8、8、8、9、9、9、10],该组数据的存储位长为10。该组数据之后的第一个数据的位数为11,则将全部连续位数在11-9位之间作为一组,即[11、11、11、10、10、10、9、9、9、9、9],该组的存储位长为11,通过采用上述分组方式,能够使连续的位数相近的差值分为一组,使得每组的位长能在有效容纳绝对值最大的差值的同时,有效减少该组中每个差值所占的位数,进而能够有效压缩数据,减少数据存储所需空间。
与此同时,通过对数据进行分组存储,每组的第一个整数样点数据为原值存储,使得若每组中存在累积误差,则误差只能在该组内传播,不会影响其他组数据,由此能够有效防止累积误差导致数据失真。
在一个可选的实施例中,在将二进制数据的位数相差预设范围的整数样点数据分为一组时,也可以选择将后一数据大于前一数据预设位数的数据分为一组,举例来说,若将差值转换为二进制数据之后,二进制数据的位数(包含符号位)为8、8、8、8、9、9、9、10、11、11、11、10、10、10、9、9、9、9、9……,若将位数相差2位的整数样点数据分为一组,则从第一个差值开始,将全部连续位数在8-10位之间的数据分为一组,即[8、8、8、8、9、9、9、10],该组数据的存储位长为10。该组数据之后的第一个数据的位数为11,则将全部连续位数在11-13位之间作为一组,即[11、11、11],该组的存储位长为11。该组之后的第一个数据的位数为10,则将全部连续位数在10-12位之间作为一组,即[10、10、10],该组的存储位长为10。该组之后的第一个数据的位数为9,则全部连续位数在9-11位之间作为一组,即[9、9、9、9、9]。通过采用上述分组方式,能够在对数据进行分组时,考虑到数值增加或减小的趋势性,使位数最相近的差值分为一组,实现最优样点分组。
图9示出了一种采用非定长分组的示例性数据存储结构。如图9所示,第一组的样点数为170个,样点1为第一组样点数据中的第1个数据,其存储第1个整数样点数据对应的二进制值,其存储位长为预设位长,该预设位长一般可根据需要选择采用32个二进制位,或小于32个二进制位。差值2存储第2个整数样点数据与第1个整数样点数据的差值对应的二进制值,差值3存储第3个整数样点数据与第2个整数样点数据的差值对应的二进制值,依此类推,差值170存储第170个整数样点数据与第169个整数样点数据的差值对应的二进制值,差值2至差值170的存储位长为P1,P1等于差值2至差值170中绝对值最大的差值所对应的二进制数据的位长,该二进制数据的位长包含1位符号位。
第二组的样点数为10个,样点171为第二组中的第1个数据,其存储第171个整数样点数据对应的二进制值,存储位长为预设位长,该预设位长一般可根据需要选择采用32个二进制位,或小于32个二进制位。差值172存储第172个整数样点数据与第171个整数样点数据的差值对应的二进制值,差值173存储第173个整数样点数据与第172个整数样点数据的差值对应的二进制值,依此类推,差值180存储第180个整数样点数据与第179个整数样点数据的差值对应的二进制值,差值172至差值180的存储位长为P2,P2等于差值172至差值180中绝对值最大的差值所对应的二进制数据的位长,该二进制数据的位长包含1位符号位。
在一个可选的实施例中,在步骤S302中对数据进行分组时,也可以采用定长分组方法,即按照每组中的样点数相同的方式对数据进行分组,比如,可以采用每组均为90个样点或120个样点的方式进行分组。
图10示出了每组中包含90个样点的定长分组方法所对应的示例性数据存储结构。如图10所示,该地震道数据块中,顺序将连续的每90个样点数据分为一组,其中,样点1为第一组中的第1个数据,其存储第1个整数样点数据对应的二进制值,其存储位长为预设位长,该预设位长一般可根据需要选择采用32个二进制位,或小于32个二进制位。差值2存储第2个整数样点数据与第1个整数样点数据的差值对应的二进制值,差值3存储第3个整数样点数据与第2个整数样点数据的差值对应的二进制值,依此类推,差值90存储第90个整数样点数据与第89个整数样点数据的差值对应的二进制值,差值2至差值90的存储位长为P1,P1等于差值2至差值90中绝对值最大的差值所对应的二进制数据的位长,该二进制数据的位长包含1位符号位。
样点91为第二组中的第1个数据,其存储第91个整数样点数据对应的二进制值,其存储位长为预设位长,该预设位长一般可根据需要选择采用32个二进制位,或小于32个二进制位。差值92存储第92个整数样点数据与第91个整数样点数据的差值对应的二进制值,差值93存储第93个整数样点数据与第92个整数样点数据的差值对应的二进制值,依此类推,差值180存储第180个整数样点数据与第179个整数样点数据的差值对应的二进制值,差值92至差值180的存储位长为P2,P2等于差值92至差值180中绝对值最大的差值所对应的二进制数据的位长,该二进制数据的位长包含1位符号位。依此类推,对后续数据按照每组90个数据进行定长分组。
图11示出对压缩进行校验报警的步骤的流程图,如图11所示,地震勘探数据压缩方法的校验报警包括:
步骤S1101:随机读取任一组内第一样点至第M样点对应的M个二进制数据,M小于等于组内样点的总数。
值得说明的是,对压缩进行校验报警时可以选择解压缩多个地震道数据块进行校验,也可以选择某一地震道数据块进行校验。本领域技术人员可以理解的是,进行校验时所选最小数据单位为某一地震道数据块中某一组样点数据中的第一样点数据至第Z样点数据,其中,Z小于等于该组样点数据中的样点数。所以,在步骤S1101中,可以选择读取多个地震道数据块对应的所有样点数据,也可以选择读取某一地震道数据块对应的所有样点数据,还可以选择读取某一地震道数据块对应的某一组样点数据,或者选择读取某一组样点数据中的第1样点至第M样点对应的M个二进制数据,M小于等于组内样点的总数。
其中,该步骤中的数据读取数量根据需要进行选择。
步骤S1102:将M个二进制数据转换为M个整数数据。
可以理解的是,该步骤中对上述步骤S1101所读取的数据进行转换,将读取的二进制数据转换为整数数据。
步骤S1103:将M个整数数据相加,得到第M样点对应的整数样点数据。
值得说明的是,若步骤S1101中读取的数据为某一组样点数据中的第1样点至第M样点对应的M个二进制数据,则对数据进行解压时,第1样点对应的二进制数据转换为整数之后,对应的数值为第1整数样点数据,第2样点对应的二进制数据转换为整数数据之后,与第1样点对应的整数样点数据相加,得到第2整数样点数据,第3样点对应的二进制数据转换为整数之后,与第1整数样点数据和第2整数样点数据相加,得到第3整数样点数据,依此类推,第M样点对应的二进制数据转换为整数之后,与第1整数样点数据至第M-1整数样点数据相加,得到第M整数样点数据。
若步骤S1101中读取的数据为某一组样点数据,则在对数据进行解压时,参考上述方法,得到该组样点数据对应的所有整数样点数据,在此不再赘述。
若步骤S1101中读取的数据为某一地震道数据块对应的所有样点数据,则将该地震道数据块中所有组样点数据,参照上述方法,得到该地震道数据块中所有组样点数据对应的所有整数样点数据,在此不再赘述。
若步骤S1101中读取的数据为多个地震道数据块对应的所有样点数据,则将多个地震道数据块中的每个地震道数据块的所有组样点数据,参照上述方法,得到多个地震道数据块中的每个地震道数据块的所有组样点数据对应的所有整数样点数据,在此不再赘述。
步骤S1104:将第M样点对应的整数样点数据乘以比例因数,得到解压后的数据。
其中,将上述步骤得到的整数样点数据分别乘以对应的比例因数,即可得到解压后的数据。
步骤S1105:计算第M样点的实际样点数据与解压后的数据的误差值。
其中,在对压缩进行校验报警时,可以通过控制器进行控制,单独设置一个线程,对样点数据进行缓存,记录样点数据的原值,即实际样点数据,然后,利用控制器对压缩后的数据进行读取、解压缩,与对应的原值进行比较,实现校验报警。
步骤S1106:判断误差值是否大于预设阈值。
步骤S1107:若是,发出报警指令。
下面,以新疆某三维项目6912(288道*24线)道三维采集文件的地震原始勘探数据为例,对本发明实施例的地震数据压缩方法进行详细说明:
值得说明的是,该项目的采样时间点间隔为2ms,地震勘探仪器系统型号为Hawk,增益为24dB。
通过对数据和振动情况分析可知,接收设备的数据经历以下三个阶段:
1、在0时刻至激发初至到的时间(0-0.4s)为在能量到达该采集设备之前,采集设备采集到的都为环境噪音,其变动幅度和绝对数值都较小。
2、初至到达一段时间内(0.4-2.2s)为在激发能量传输至该采集设备始至一段时间内(时长由距离激发点的距离和激发能量决定),地表振动较剧烈,样点的真值变动幅度较大,绝对数值也较大,为高频高幅度。但是受限于仪器最大输入信号的限制,其真值不会超过最大输入信号范围。
3、初至到达一定时间后(2.2-6s)为激发能量经过该采集设备一段时间后,地表振动逐渐减小,样点真值变动幅度逐渐减小,绝对数值较大,但变动幅度逐渐变小,为低频高幅度。最终能量完全消散,恢复至仅采集环境噪音的状态。
根据上述各阶段,将某一地震仪器采集的地震道数据进行筛选,以阶段1的部分数据进行举例说明,阶段1的部分数据如下:
Figure BDA0001842814840000221
Figure BDA0001842814840000231
采用本发明实施例的地震勘探数据压缩方法对上述数据进行压缩存储:
首先,根据文件头段中记载的仪器型号Hawk和增益24dB,在表2所示的对应关系表,查找到该地震勘探仪器系统的等效输入噪声为0.1μV。
根据等效输入噪声0.1μV,选取比例因数,该比例因数小于等于等效输入噪声0.1μV,大于地震勘探仪器系统能够分辨的最小输入电压。以比例因数等于等效输入噪声0.1μV为例,将样点数据除以该比例因数0.1,得到样点数据扩大值如下:
Figure BDA0001842814840000232
Figure BDA0001842814840000241
然后,对上述数据进行四舍五入取整,得到下列整数样点数据:
Figure BDA0001842814840000242
Figure BDA0001842814840000251
计算每一个整数样点数据与前一整数样点数据的差值,得到如下数据:
Figure BDA0001842814840000252
将上述差值转换为二进制数据,得到如下结果:
Figure BDA0001842814840000253
Figure BDA0001842814840000261
若本项目采用定长分组方式,每90个样点数据作为一组,则上述样点数据位于同一组内。
设第1个数据的存储位长为32个二进制位,不足32位的前面补0。其他数据的存储位长为绝对值最大的差值的存储位长,即9位,不足9位的前面补0,则将数据存储为:
Figure BDA0001842814840000271
通过计算,该列数据若采用本发明实施例中的地震勘探数据压缩方法进行压缩存储时占用的总位长为:32+9×23=239。
若以现有技术中的Seg-Y存储结构对上述数据进行存储,存储数据如下:
Figure BDA0001842814840000281
通过计算,该列数据若采用Seg-Y存储结构进行存储时占用的总位长为:32×24=768。
通过对上述一列数据进行存储,将本发明实施例所示地震勘探数据压缩方法的压缩率可达32%左右。若将本发明实施例所示地震勘探数据压缩方法应用至海量地震勘探数据中,压缩效果更加显著,另外,上述示例仅示例出了采用定长分组方法进行定长压缩时的压缩率,若采用非定长分组方法对上述数据进行非定长压缩,则压缩效果更好。
图12为本发明另一实施例的地震勘探数据压缩方法的流程图一;该另一实施例与上述实施例的区别在于:
上述实施例将每组整数样点数据中的第一个整数样点数据转换为预设位长的二进制数据进行存储或传输。
而该另一实施例将每组整数样点数据中的第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输。
下面结合图12说明该另一实施例的地震勘探数据压缩方法,该地震勘探数据压缩方法在包括:
步骤S1201:根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据。
其中,将样点数据进行取整时,考虑到地震勘探仪器系统在上述三个阶段所采集到的样点数据都包含噪音,该噪音包括:外部环境噪音以及地震勘探仪器系统的等效输入噪声(即地震勘探仪器系统的内部噪音,也称热噪声)。当没有激发能量时,若样点数据的真值小于地震勘探仪器系统的等效输入噪声时,该样点数据为无效数据(也可称为坏数据),应当剔除。另外,由于不同地震勘探仪器系统所处的环境不同,其外部环境噪音也不同,因此不能对外部环境噪音进行统一量化去除,但是地震勘探仪器系统的等效输入噪声为固定值,可以统一量化去除,所以本发明实施例在对样点数据进行压缩之前,先根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,以便最大限度消除无效数据以及地震勘探仪器系统的等效输入噪声的影响,实现样点数据筛选和去燥,减少后续处理的数据体量,以节省存储空间并提高数据精度。
可以理解的是,由于受限于仪器最大输入信号限制,因此样点数据的真值的变动差值不会大于2倍最大输入信号。
步骤S1202:将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
值得说明的是,在对多个整数样点数据分组时,每个组中的整数样点数据是连续的一串样点数据,即顺序相邻的采样点的数据,另外,根据不同地震勘探项目的需求,分组时可以选用定长分组方法以及非定长分组方法,两种分组方法将在下文中详细描述。
步骤S1203:将每组整数样点数据中的第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输,将每组整数样点数据中的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据进行存储或传输,其中,位长P为绝对值最大的差值对应的二进制数据位数。
值得说明的是,每组数据中,将第一个数据按照对应的样点数据进行单独存储(即原值存储),作为数据解压时该组数据的基础计算点,使不同分组对应各自的基础计算点,可以有效避免压缩时的累计误差,同时可将该第一个数据作为上一组整数样点数据最后一个整数样点数据的对比控制点。
其中,第一个数据存储时的预设位长可以根据需要进行选取,对于某一地震勘探项目,可以选择将所有分组的第一个数据均采用相同的预设位长a,比如32;当然,也可以将不同分组的第一个数据根据其数值大小自由选取。
另外,该第一个数据的存储格式为采样数据的原始格式,比如浮点格式。
本实施例提供的地震勘探数据压缩方法,充分考虑了地震勘探仪器系统的等效输入噪声,对样点数据进行整型化处理,然后,利用整数样点数据与其前一整数样点数据的差值表示该样点数据,差值的存储位长为绝对值最大的差值对应的二进制数据位数,以保证所有差值都能进行有效存储的前提下,最大限度减小差值存储所需位长。
通过采用上述方法,将数值较大的采样数据转换为数值较小的差值进行存储,并对差值的存储位长进行优化,能够在不影响地震勘探数据质量的前提下,减少数据存储位数,有效减少地震道数据块所占用的存储空间,进而减少存储成本支出。
另外,通过将每组中的第一个数据原值存储,能够防止压缩时的累计误差。
图13为本发明另一实施例的地震勘探数据压缩方法的流程图二。如图13所示,该地震勘探数据压缩方法在包含上述图12所示的步骤的基础上,还可以包括:
步骤S1301:在每个地震道数据块的道头段之后,插入压缩参数字段,该压缩参数字段用于描述对应的地震道数据块中的样点数据的压缩相关信息。
值得说明的是,该方法对各步骤的先后顺序不作限制。图示仅为该方法的一种示例,不应理解为对各步骤的先后顺序的限制。
具体地,该压缩参数字段至少包括:样点数据单位、压缩单位、分组方式、预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长等信息,在此基础上,还可以包括:对数据进行取整时所采用的比例因数、对压缩数据进行校验时需要的校验参数,下面结合表3对压缩参数字段所包含的信息进行详细说明。
表3:压缩参数字段
Figure BDA0001842814840000311
值得说明的是,地震勘探采集原始数据单位依照仪器类型不同分为V和G两种,常见使用mV、mG、nV、nG。
在上述表3中,该压缩样点数据单位1字段表示该地震勘探采集原始数据单位,若取值为0,则代表该地震勘探采集原始数据单位为V,若取值为1,则代表该地震勘探采集原始数据单位为G,该压缩样点数据单位1字段的存储位长为1位。
该压缩样点数据单位2字段表示该地震勘探采集原始数据单位的具体量级,取值可设为1/10V、1/100V、mV、1/10mV、1/100mV、μ/、1/100m、1/100mV、nV、1/10nV、1/100nV中的一个,或者由用户自定义数值,该压缩样点数据单位2字段的存储位长为4位。
该比例因数字段是指在步骤S1201中对数据进行取整时采用的参数,其取值大于仪器能分辨的最小输入电压,小于等于等效输入噪声。下文中会对其进行详细说明,该比例因数字段的存储位长为32位。
该是否定长压缩字段代表步骤S1202中对整数样点数据进行分组时所采用的分组方法,若取值为0,则代表对整数样点数据进行分组时采用的是定长分组方法,若取值为1,则代表对整数样点数据进行分组时采用的是非定长分组方法,该是否定长压缩字段的存储位长为3位。
该基础点间隔字段代表对压缩数据进行校验时采用的校验参数,参数值在0~1023之间,该基础点间隔字段的存储位长为10位。
具体地,在进行数据压缩时,尤其针对非定长压缩而言,为防止某一组样点数据中样点数据的个数过多时受累计误差影响导致数据失真,还可以设置基础样点,基础样点就是不压缩的原始数据,是32位的IEEE规则的未压缩样点数据,基础样点间隔是指预定义的基础样点之间的间隔,即间隔一定数量个样点数据而设置一个基础样点,实现强制间隔一定数量个样点数据而回归一个原始样点数据,其意义主要用于校验数据,防止数据失真。
举例来说,如果非定长压缩分组时某一组数据过长,比如直接超过了一个跑记录长度,如6秒,整个数据就相当于失去了校验点,而通过间隔一定数量个样点数据而设置一个基础样点,利用基础样点记录该样点的原始数据(即通过基础点间隔体现),有效阻隔了累计误差的传播。
其中,该是否定长压缩字段的取值为0,对整数样点数据进行分组时采用定长分组方法时,压缩参数字段包括的分组信息具体为:总样点数、每组样点数、第一组原样点、第一组位长、第二组原样点、第二组位长、……第R组原样点、第R组位长,其中,R代表组数,R=总样点数÷每组样点数,当总样点数不能被每组样点数整除时,R向上取整。
具体地,该总样点数字段表示对应的地震道数据块所含样点数据的总个数,取值在0~4294967295之间,该总样点数字段的存储位长为32位。
该每组样点数字段表示每组样点数据中的样点数据个数,取值在0~4294967295之间,该每组样点数字段的存储位长为32位。
该第一组原样点~第R组原样点代表对应组样点数据中第一个样点数据的原值,存储位长为32位,采用浮点格式存储。当然,本领域技术人员能够理解的是,该第一组原样点~第R组原样点也可以根据其数值大小,选取对应的存储位长,只需保证所选的存储位长能够容纳对应样点数据即可。
该第一组位长~第R组位长分别表示对应组样点数据中除第一个样点数据之外的其他数据的存储位长,其取值在0~31之间,存储位长为5位。
另外,该是否定长压缩字段的取值为1,对整数样点数据进行分组时采用非定长分组方法时,压缩参数字段包括的分组信息具体为:压缩组数、第一组样点数、第一组原样点、第一组位长、第二组样点数、第二组原样点、第二组位长……第K组样点数、第K组原样点、第K组位长,其中,K代表组数。
具体地,该压缩组数字段表示对应的地震道数据块所含样点数据组的组数K,取值在0~4294967295之间,存储位长为32位。
该第一组样点数至第K组样点数表示对应组样点数据中的样点数据的总个数,取值在0~1023之间,存储位长为10位。
该第一组原样点至第K组原样点表示对应组样点数据中第一个样点数据的原值,存储位长为32位,采用浮点格式存储。当然,本领域技术人员能够理解的是,该第一组原样点~第R组原样点也可以根据其数值大小,选取对应的存储位长,只需保证所选的存储位长能够容纳对应样点数据即可。
该第一组位长至第K组位长表示对应组样点数据中除第一个样点数据之外的其他数据的存储位长,其取值在0~31之间,存储位长为5位。
图14为本发明另一实施例的地震勘探数据压缩方法的流程图三;如图14所示,该地震勘探数据压缩方法在包含上述图13所示的步骤的基础上,还可以包括:
步骤S1401:去除第一地震道数据块之后的地震道数据块的道头段中与第一地震道数据块的道头段相比相同的数据。
值得说明的是,对于步骤S1401,其可以在样点数据压缩之前进行,也可以在样点数据压缩之后进行,该方法对各步骤的先后顺序不作限制。图示仅为该方法的一种示例,不应理解为对各步骤的先后顺序的限制。
具体地,道头段一般包括:是否压缩头段、是否压缩数据、线号、桩号以及采样率、增益等参数段的起止地址和数据内容等。
举例来说,某一地震勘探项目中,某一地震道数据块的道头段与前一地震道数据块的道头段相比,只有线号桩号以及设备状态信息不同,通过本发明实施例提供的方法,使第一地震道数据块的道头段记载上述全部信息,第一地震道数据块之后的地震道数据块的道头段仅记载线号桩号以及设备状态信息,实现道头段数据压缩,进一步减少存储所需空间,进而减少存储成本。
图15为采用本发明实施例中压缩后的地震数据存储结构的示意图。如图15所示,该地震数据存储结构包括:文件头段、炮头段以及地震道数据三大部分,该地震道数据分为若干个地震道数据块(分别记为第1道~第S道),每一个地震道数据块又包括一个道头段、压缩参数字段以及若干个样点(分别记为样点1~样点Z)。
其中,该文件头段一般为3200比特,该炮头段一般为400比特。
第1道的道头段一般为240比特。第2道至第S道的道头段因为一般仅记载线号桩号以及设备状态信息,所以小于240比特。
以该第1道为例,对地震道数据块的存储结构进行详细说明。
其中,该压缩参数字段至少包括:样点数据单位、压缩单位、分组方式、预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长、对数据进行取整时所采用的比例因数、对压缩数据进行校验时需要的校验参数等。
该样点1字段所存储的数值为第1个样点数据的原值,存储格式可以为浮点格式,存储位长为预设位长,该预设位长一般可根据需要选择采用32位,或小于32位。
该差值2字段所存储的数值为将第2个样点对应的整数样点数据减去第1个样点对应的整数样点数据所得的差值对应的二进制值。
该差值3字段所存储的数值为将第3个样点对应的整数样点数据减去第2个样点对应的整数样点数据所得的差值对应的二进制值,依此类推。
该差值Z字段所存储的数值为将第Z个样点对应的整数样点数据减去第Z-1个样点对应的整数样点数据所得的差值对应的二进制值。
其中,差值2至差值Z的存储位长P为差值2至差值Z中绝对值最大的差值所对应的二进制值的位数,其中,符号位占一位。
其中,上述地震数据存储结构相当于没有对样点数据进行分组时的存储结构,即分组数N=1。这种不对样点数据进行分组的方式能够有效压缩数据,减小数据所需的存储空间,但是,有可能会出现累计误差,使得数据容易失真。其中,可以通过对数据进行分组的方式来有效防止累计误差导致数据容易失真的问题,后文中将对数据分组的方式进行详细叙述,在此不再赘述。
在一个可选的实施例中,步骤S1201包括:
根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声。
其中,仪器型号、增益以及等效输入噪声的对应关系是在仪器出厂时便固定的,仪器型号、增益以及等效输入噪声的对应关系表由厂家提供,将仪器型号、增益以及等效输入噪声的对应关系表输入至控制器中,控制器通过读取文件头段中的仪器型号和增益信息,在对应关系表中查找对应的地震勘探仪器系统的等效输入噪声。
根据等效输入噪声,选取一比例因数,其中,比例因数小于等于等效输入噪声,大于地震数据勘探时采样的最小单位。
其中,若地震勘探仪器系统的等效输入噪声为0.1μ.,则选取的比例因数小于等于0.1μ.即可,另外,一般地震勘探项目采用的仪器能够分辨的最小输入电压大于0.1nV,所以,比例因数应大于地震勘探项目采用的仪器能够分辨的最小输入电压,即比例因数大于0.1nV。若比例因数小于0.1nV,由于仪器只能分辨到0.1nV,相当于采集到的数据最小位为0.1nV,所以,若比例因数小于0.1nV,则会在取整时将样点数据扩大过多倍数,影响数据压缩效率。另外,在选择比例因数时,还可以考虑数据采集需求,如:若作为地震勘探采集现场处理数据,需要最大程度考虑数据的有效性,此时,可将比例因数取值为1nV或0.1nV(1nG或0.1nG),当采集数据的需求为用于现场质量控制时,则仅需考虑地震道的噪音水平、能量、频率等属性,可以将比例因数取值为10nV或0.1mV(10nG或0.1mG)。
将样点数据除以比例因数之后,进行四舍五入取整。
其中,通过将样点数据除以比例因数,将数据扩大,使得能够在将噪声去除的基础上,最大限度保证样点实际真值,防止数据失真。
通过上述取整方法,能够实现在消除无效数据以及地震勘探仪器系统的等效输入噪声的影响的前提下,使去除的数据小于该等效输入噪声,防止数据失真,保证数据无损压缩。
在一个可选的实施例中,对整数样点数据可以进行非定长分组,具体包括:
将每个整数样点数据与其前一整数样点数据的差值转换为二进制数据;
将二进制数据的位数相差预设范围的整数样点数据分为一组。
举例来说,若将差值转换为二进制数据之后,二进制数据的位数(包含符号位)为8、8、8、8、9、9、9、10、11、11、11、10、10、10、9、9、9、9、9……,若将位数相差2位的整数样点数据分为一组,则从第一个差值开始,将全部连续位数在8-10位之间的数据分为一组,即[8、8、8、8、9、9、9、10],该组数据的存储位长为10。该组数据之后的第一个数据的位数为11,则将全部连续位数在11-9位之间作为一组,即[11、11、11、10、10、10、9、9、9、9、9],该组的存储位长为11,通过采用上述分组方式,能够使连续的位数相近的差值分为一组,使得每组的位长能在有效容纳绝对值最大的差值的同时,有效减少该组中每个差值所占的位数,进而能够有效压缩数据,减少数据存储所需空间。并且,通过对数据进行分组存储,每组的第一个整数样点数据为原值存储,使得若每组中存在累积误差,则误差只能在该组内传播,不会影响其他组数据,由此能够有效防止累积误差导致数据失真。
当然,在将二进制数据的位数相差预设范围的整数样点数据分为一组时,也可以选择将后一数据大于前一数据预设位数的数据分为一组,举例来说,若将差值转换为二进制数据之后,二进制数据的位数(包含符号位)为8、8、8、8、9、9、9、10、11、11、11、10、10、10、9、9、9、9、9……,若将位数相差2位的整数样点数据分为一组,则从第一个差值开始,将全部连续位数在8-10位之间的数据分为一组,即[8、8、8、8、9、9、9、10],该组数据的存储位长为10。该组数据之后的第一个数据的位数为11,则将全部连续位数在11-13位之间作为一组,即[11、11、11],该组的存储位长为11。该组之后的第一个数据的位数为10,则将全部连续位数在10-12位之间作为一组,即[10、10、10],该组的存储位长为10。该组之后的第一个数据的位数为9,则全部连续位数在9-11位之间作为一组,即[9、9、9、9、9]。通过采用上述分组方式,能够在对数据进行分组时,考虑到数值增加或减小的趋势性,使位数最相近的差值分为一组,实现最优样点分组。
图16示出了一种采用非定长分组的示例性数据存储结构。如图16所示,第一组的样点数为170个,样点1为第一组样点数据中的第1个数据,其存储第1样点数据的原值,采用浮点格式,存储位长为预设位长,该预设位长一般可根据需要选择采用32位,或小于32位。差值2存储第2个整数样点数据与第1个整数样点数据的差值对应的二进制值,差值3存储第3个整数样点数据与第2个整数样点数据的差值对应的二进制值,依此类推,差值170存储第170个整数样点数据与第169个整数样点数据的差值对应的二进制值,差值2至差值170的存储位长为P1,P1等于差值2至差值170中绝对值最大的差值所对应的二进制数据的位长,该二进制数据的位长包含1位符号位。
第二组的样点数为10个,样点171为第二组中的第1个数据,其存储第171个样点数据的原值,采用浮点格式,存储位长为预设位长,该预设位长一般可根据需要选择采用32位,或小于32位。差值172存储第172个整数样点数据与第171个整数样点数据的差值对应的二进制值,差值173存储第173个整数样点数据与第172个整数样点数据的差值对应的二进制值,依此类推,差值180存储第180个整数样点数据与第179个整数样点数据的差值对应的二进制值,差值172至差值180的存储位长为P2,P2等于差值172至差值180中绝对值最大的差值所对应的二进制数据的位长,该二进制数据的位长包含1位符号位。
在一个可选的实施例中,在步骤S1202中对数据进行分组时,也可以采用定长分组方法,即按照每组中的样点数相同的方式对数据进行分组,比如,可以采用每组均为90个样点或120个样点的方式进行分组。
图17示出了每组中包含90个样点的定长分组方法所对应的示例性数据存储结构。如图17所示,该地震道数据块中,顺序将连续的每90个样点数据分为一组,其中,样点1为第一组中的第1个数据,其存储第1个样点数据的原值,采用浮点格式,存储位长为预设位长,该预设位长一般可根据需要选择采用32位,或小于32位。差值2存储第2个整数样点数据与第1个整数样点数据的差值对应的二进制值,差值3存储第3个整数样点数据与第2个整数样点数据的差值对应的二进制值,依此类推,差值90存储第90个整数样点数据与第89个整数样点数据的差值对应的二进制值,差值2至差值90的存储位长为P1,P1等于差值2至差值90中绝对值最大的差值所对应的二进制数据的位长,该二进制数据的位长包含1位符号位。
样点91为第二组中的第1个数据,其存储第91个样点数据的原值,采用浮点格式,存储位长为预设位长,该预设位长一般可根据需要选择采用32位,或小于32位。差值92存储第92个整数样点数据与第91个整数样点数据的差值对应的二进制值,差值93存储第93个整数样点数据与第92个整数样点数据的差值对应的二进制值,依此类推,差值180存储第180个整数样点数据与第179个整数样点数据的差值对应的二进制值,差值92至差值180的存储位长为P2,P2等于差值92至差值180中绝对值最大的差值所对应的二进制数据的位长,该二进制数据的位长包含1位符号位。依此类推,对后续数据按照每组90个数据进行定长分组。
图18示出对压缩进行校验报警的步骤的流程图,如图18所示,地震勘探数据压缩方法的校验报警包括:
步骤S1801:随机读取任一组内第一样点至第M样点对应的M个数据,M小于等于组内样点的总数。
值得说明的是,对压缩进行校验报警时可以选择解压缩多个地震道数据块进行校验,也可以选择某一地震道数据块进行校验。本领域技术人员可以理解的是,进行校验时所选最小数据单位为某一地震道数据块中某一组样点数据中的第一样点数据至第Z样点数据,其中,Z小于等于该组样点数据中的样点数。所以,在步骤S1101中,可以选择读取多个地震道数据块对应的所有样点数据,也可以选择读取某一地震道数据块对应的所有样点数据,还可以选择读取某一地震道数据块对应的某一组样点数据,或者选择读取某一组样点数据中的第1样点至第M样点对应的M个数据,M小于等于组内样点的总数。
其中,该步骤中的数据读取数量根据需要进行选择。
步骤S1802:将M个数据中的二进制数据转换为整数数据。
步骤S1803:将整数数据乘以比例因子,得到对应的解压数据。
步骤S1804:将经过上述处理的M个数据相加,得到第M样点对应的理论解压样点数据。
值得说明的是,若步骤S1801中读取的数据为某一组样点数据中的第1样点至第M样点对应的M个数据,则对数据进行解压时,第1样点对应的数值为第1样点数据的原值,第2样点对应的二进制数据转换为整数数据之后,与第1样点对应的数值相加,得到理论解压第2样点数据,第3样点对应的二进制数据转换为整数之后,与第1样点和第2样点的数据相加,得到理论解压第3样点数据,依此类推,第M样点对应的二进制数据转换为整数之后,与第1样点至第M-1样点的数据相加,得到理论解压第M样点数据。
若步骤S1801中读取的数据为某一组样点数据,则在对数据进行解压时,参考上述方法,得到该组样点数据对应的所有理论解压样点数据,在此不再赘述。
若步骤S1801中读取的数据为某一地震道数据块对应的所有样点数据,则将该地震道数据块中所有组样点数据,参照上述方法,得到该地震道数据块中所有组样点数据对应的理论解压样点数据,在此不再赘述。
若步骤S1801中读取的数据为多个地震道数据块对应的所有样点数据,则将多个地震道数据块中的每个地震道数据块的所有组样点数据,参照上述方法,得到多个地震道数据块中的每个地震道数据块的所有组样点数据对应的理论解压样点数据,在此不再赘述。
步骤S1805:计算第M样点的实际样点数据与第M样点的理论解压样点数据的误差值。
其中,在对压缩进行校验报警时,可以通过控制器进行控制,单独设置一个线程,对样点数据进行缓存,记录样点数据的原值,即实际样点数据,然后,利用控制器对压缩后的数据进行读取、解压缩,与对应的原值进行比较,实现校验报警。
步骤S1806:判断误差值是否大于预设阈值。
步骤S1807:若是,发出报警指令。
下面,以上述的新疆某三维项目6912(288道*24线)道三维采集文件的地震原始勘探数据为例,对本发明该另一实施例的地震数据压缩方法进行详细说明:
值得说明的是,该项目的采样时间点间隔为2ms,地震勘探仪器系统型号为Hawk,增益为24dB。
通过对数据和振动情况分析可知,接收设备的数据经历以下三个阶段:
1、在0时刻至激发初至到的时间(0-0.4s)为在能量到达该采集设备之前,采集设备采集到的都为环境噪音,其变动幅度和绝对数值都较小。
2、初至到达一段时间内(0.4-2.2s)为在激发能量传输至该采集设备始至一段时间内(时长由距离激发点的距离和激发能量决定),地表振动较剧烈,样点的真值变动幅度较大,绝对数值也较大,为高频高幅度。但是受限于仪器最大输入信号的限制,其真值不会超过最大输入信号范围。
3、初至到达一定时间后(2.2-6s)为激发能量经过该采集设备一段时间后,地表振动逐渐减小,样点真值变动幅度逐渐减小,绝对数值较大,但变动幅度逐渐变小,为低频高幅度。最终能量完全消散,恢复至仅采集环境噪音的状态。
根据上述各阶段,将某一地震仪器采集的地震道数据进行筛选,以阶段1的部分数据进行举例说明,阶段1的部分数据如下:
Figure BDA0001842814840000401
Figure BDA0001842814840000411
采用本发明实施例的地震勘探数据压缩方法对上述数据进行压缩存储:
首先,根据文件头段中记载的仪器型号Hawk和增益24dB,在表2所示的对应关系表,查找到该地震勘探仪器系统的等效输入噪声为0.1μV。
根据等效输入噪声0.1μV,选取比例因数,该比例因数小于等于等效输入噪声0.1μV,大于地震勘探仪器系统能够分辨的最小输入电压。以比例因数等于等效输入噪声0.1μV为例,将样点数据除以该比例因数0.1,得到样点数据扩大值如下:
Figure BDA0001842814840000412
Figure BDA0001842814840000421
然后,对上述数据进行四舍五入取整,得到下列整数样点数据:
Figure BDA0001842814840000422
Figure BDA0001842814840000431
计算除第一样点之外的每一个整数样点数据与前一整数样点数据的差值,得到如下数据:
Figure BDA0001842814840000432
将上述数据中除第一样点之外的每一个样点对应的数据的转换为二进制数据,得到如下结果:
Figure BDA0001842814840000441
若本项目采用定长分组方式,每90个样点数据作为一组,则上述样点数据位于同一组内。
设第1个数据的存储位长为32位,采用浮点格式。其他数据的存储位长为绝对值最大的差值的存储位长,即9位,不足9位的前面补0,采用二进制格式,则将数据存储为:
Figure BDA0001842814840000451
通过计算,该列数据若采用本发明实施例中的地震勘探数据压缩方法进行压缩存储时占用的总位长为:32+9×23=239。
若以现有技术中的Seg-Y存储结构对上述数据进行存储,存储数据如下:
Figure BDA0001842814840000461
通过计算,该列数据若采用Seg-Y存储结构进行存储时占用的总位长为:32×24=768。
通过对上述一列数据进行存储,将本发明实施例所示地震勘探数据压缩方法的压缩率可达32%左右。若将本发明实施例所示地震勘探数据压缩方法应用至海量地震勘探数据中,压缩效果更加显著,另外,上述示例仅示例出了采用定长分组方法进行定长压缩时的压缩率,若采用非定长分组方法对上述数据进行非定长压缩,则压缩效果更好。
基于同一发明构思,本申请实施例还提供了一种地震勘探数据压缩装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于地震勘探数据压缩装置解决问题的原理与上述方法相似,因此地震勘探数据压缩装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图19为本发明实施例的地震勘探数据压缩装置的结构图一。如图19所示,该地震勘探数据压缩装置1包括:取整模块100、分组模块200以及第一数据压缩模块300。
该取整模块100用于根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据。
其中,将样点数据进行取整时,考虑到地震勘探仪器系统在上述三个阶段所采集到的样点数据都包含噪音,该噪音包括:外部环境噪音以及地震勘探仪器系统的等效输入噪声(即地震勘探仪器系统的内部噪音,也称热噪声)。当没有激发能量时,若样点数据的真值小于地震勘探仪器系统的等效输入噪声时,该样点数据为无效数据(也可称为坏数据),应当剔除。另外,由于不同地震勘探仪器系统所处的环境不同,其外部环境噪音也不同,因此不能对外部环境噪音进行统一量化去除,但是地震勘探仪器系统的等效输入噪声为固定值,可以统一量化去除,所以本发明实施例在对样点数据进行压缩之前,先根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,以便最大限度消除无效数据以及地震勘探仪器系统的等效输入噪声的影响,实现样点数据筛选和去燥,减少后续处理的数据体量,以节省存储空间并提高数据精度。
可以理解的是,由于受限于仪器最大输入信号限制,因此样点数据的真值的变动差值不会大于2倍最大输入信号。
在一个可选的实施例中,该取整模块100可以包括:噪声识别单元101、比例因数选取单元102以及数据取整单元103,如图20所示。
其中,该噪声识别单元101用于根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声。
其中,仪器型号、增益以及等效输入噪声的对应关系是在仪器出厂时便固定的,仪器型号、增益以及等效输入噪声的对应关系表由厂家提供,将仪器型号、增益以及等效输入噪声的对应关系表输入至控制器中,控制器通过读取文件头段中的仪器型号和增益信息,在对应关系表中查找对应的地震勘探仪器系统的等效输入噪声。
该比例因数选取单元102用于根据所述等效输入噪声,选取一比例因数,其中,所述比例因数小于等于所述等效输入噪声,大于地震数据勘探时采样的最小单位。
若地震勘探仪器系统的等效输入噪声为0.1μ.,则选取的比例因数小于等于0.1μ.即可,另外,一般地震勘探项目采用的仪器能够分辨的最小输入电压大于0.1nV,所以,比例因数应大于地震勘探项目采用的仪器能够分辨的最小输入电压,即比例因数大于0.1nV。若比例因数小于0.1nV,由于仪器只能分辨到0.1nV,相当于采集到的数据最小位为0.1nV,所以,若比例因数小于0.1nV,则会在取整时将样点数据扩大过多倍数,影响数据压缩效率。
另外,在选择比例因数时,还可以考虑数据采集需求,如:若作为地震勘探采集现场处理数据,需要最大程度考虑数据的有效性,此时,可将比例因数取值为1nV或0.1nV(1nG或0.1nG),当采集数据的需求为用于现场质量控制时,则仅需考虑地震道的噪音水平、能量、频率等属性,可以将比例因数取值为10nV或0.1mV(10nG或0.1mG)。
该数据取整单元103用于将样点数据除以所述比例因数之后,进行四舍五入取整。
其中,通过将样点数据除以比例因数,将数据扩大,使得能够在将噪声去除的基础上,最大限度保证样点实际真值,防止数据失真。
通过上述取整模块,能够实现在消除无效数据以及地震勘探仪器系统的等效输入噪声的影响的前提下,使去除的数据小于该等效输入噪声,防止数据失真,保证数据无损压缩。
分组模块200用于将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数。
在一个可选的实施例中,分组模块200可以将每个地震道数据块中的多个整数样点数据平均分为N组,即按照每组中的样点数相同的方式对数据进行分组,比如,可以采用每组均为90个样点或120个样点的方式进行分组。
值得说明的是,在对多个整数样点数据分组时,每个组中的整数样点数据是连续的一串样点数据,即顺序相邻的采样点的数据,另外,根据不同地震勘探项目的需求,分组时可以选用定长分组方法以及非定长分组方法。
在一个可选的实施例中,分组模块包括:数据转换单元201以及数据分组单元202,如图21所示。该数据转换单元201用于将每个整数样点数据与其前一整数样点数据的差值转换为二进制数据。该数据分组单元202用于将二进制数据的位数相差预设范围的整数样点数据分为一组。
举例来说,若将差值转换为二进制数据之后,二进制数据的位数(包含符号位)为8、8、8、8、9、9、9、10、11、11、11、10、10、10、9、9、9、9、9……,若将位数相差2位的整数样点数据分为一组,则从第一个差值开始,将全部连续位数在8-10位之间的数据分为一组,即[8、8、8、8、9、9、9、10],该组数据的存储位长为10。该组数据之后的第一个数据的位数为11,则将全部连续位数在11-9位之间作为一组,即[11、11、11、10、10、10、9、9、9、9、9],该组的存储位长为11,通过采用上述分组方式,能够使连续的位数相近的差值分为一组,使得每组的位长能在有效容纳绝对值最大的差值的同时,有效减少该组中每个差值所占的位数,进而能够有效压缩数据,减少数据存储所需空间。
与此同时,通过对数据进行分组存储,每组的第一个整数样点数据为原值存储,使得若每组中存在累积误差,则误差只能在该组内传播,不会影响其他组数据,由此能够有效防止累积误差导致数据失真。
在一个可选的实施例中,在将二进制数据的位数相差预设范围的整数样点数据分为一组时,也可以选择将后一数据大于前一数据预设位数的数据分为一组,举例来说,若将差值转换为二进制数据之后,二进制数据的位数(包含符号位)为8、8、8、8、9、9、9、10、11、11、11、10、10、10、9、9、9、9、9……,若将位数相差2位的整数样点数据分为一组,则从第一个差值开始,将全部连续位数在8-10位之间的数据分为一组,即[8、8、8、8、9、9、9、10],该组数据的存储位长为10。该组数据之后的第一个数据的位数为11,则将全部连续位数在11-13位之间作为一组,即[11、11、11],该组的存储位长为11。该组之后的第一个数据的位数为10,则将全部连续位数在10-12位之间作为一组,即[10、10、10],该组的存储位长为10。该组之后的第一个数据的位数为9,则全部连续位数在9-11位之间作为一组,即[9、9、9、9、9]。通过采用上述分组方式,能够在对数据进行分组时,考虑到数值增加或减小的趋势性,使位数最相近的差值分为一组,实现最优样点分组。
第一数据压缩模块300用于将每组整数样点数据中除第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为将绝对值最大的差值对应的二进制数据位数。
在一个可选的实施例中,该地震勘探数据压缩装置还可以包括:第二数据压缩模块,用于将每组整数样点数据中的第一个整数样点数据转换为预设位长的二进制数据。
或者,在另一个可选的实施例中,该地震勘探数据压缩装置还可以包括:数据存储模块,将每组整数样点数据中的第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输。
值得说明的是,在上述实施例中,通过对整数样点数据进行分组,每组整数样点数据中,将第一个整数样点数据转换为预设位长的二进制数据(即实际数据)进行单独存储,或者,将第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输,即原值存储,作为数据解压时该组整数样点数据的基础计算点,使不同分组对应各自的基础计算点,可以有效避免压缩时的累计误差,同时可将该第一个数据作为上一组整数样点数据最后一个整数样点数据的对比控制点。
其中,第一个数据存储时的预设位长可以根据需要进行选取,对于某一地震勘探项目,可以选择将所有分组的第一个数据均采用相同的预设位长a,比如32;当然,也可以将不同分组的第一个数据根据其数值大小自由选取。
在一个可选的实施例中,该地震勘探数据压缩装置还可以包括:压缩参数插入模块400和道头压缩模块500,如图22所示。
其中,该压缩参数插入模块400用于在每个所述地震道数据块的所述道头段之后,插入压缩参数字段,该压缩参数字段用于描述对应的地震道数据块中的样点数据的压缩相关信息。
具体地,压缩参数字段包括:样点数据单位、压缩单位、分组方式、所述预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长。
其中,该道头压缩模块500用于去除第一地震道数据块之后的地震道数据块的道头段中与第一地震道数据块的道头段相比相同的数据。
具体地,道头段一般包括:是否压缩头段、是否压缩数据、线号、桩号以及采样率、增益等参数段的起止地址和数据内容等。
某一地震道数据块的道头段与前一地震道数据块的道头段相比,一般只有线号桩号以及设备状态信息不同,所以,在地震勘探项目中,一般第一地震道数据块的道头段记载上述全部信息,第一地震道数据块之后的地震道数据块的道头段一般仅记载线号桩号以及设备状态信息。
通过采用道头压缩模块模块,实现道头段的数据压缩,进一步减少存储所需空间,进而减少存储成本。
在一个可选的实施例中,如图23所示,该地震勘探数据压缩装置还可以包括:校验数据读取模块600、校验数据转换模块700、校验数据解压模块800、校验数据还原模块900、压缩误差计算模块1000、压缩精度判断模块1100以及压缩失真报警模块1200。
其中,校验数据读取模块600用于随机读取任一组内第一样点至第M样点对应的M个数据,M小于等于所述组内样点的总数。
值得说明的是,对压缩进行校验报警时可以选择解压缩多个地震道数据块进行校验,也可以选择某一地震道数据块进行校验。本领域技术人员可以理解的是,进行校验时所选最小数据单位为某一地震道数据块中某一组样点数据中的第一样点数据至第Z样点数据,其中,Z小于等于该组样点数据中的样点数。所以,校验数据读取模块600可以选择读取多个地震道数据块对应的所有样点数据,也可以选择读取某一地震道数据块对应的所有样点数据,还可以选择读取某一地震道数据块对应的某一组样点数据,或者选择读取某一组样点数据中的第1样点至第M样点对应的M个数据,M小于等于组内样点的总数。
其中,该校验数据读取模块600的数据读取数量根据需要进行选择。
校验数据转换模块700用于将M个数据中的二进制数据转换为整数数据。
当将每组整数样点数据中的第一个整数样点数据转换为预设位长的二进制数据时,校验数据解压模块800用于将M个数据相加,得到第M样点对应的整数样点数据。校验数据还原模块900用于将整数样点数据乘以比例因数,得到解压后的数据。
当将每组整数样点数据中的第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输时,校验数据解压模块800用于将所述整数数据乘以比例因子,得到对应的解压数据;校验数据还原模块900用于将经过上述处理的M个数据相加,得到第M样点对应的理论解压样点数据。压缩误差计算模块1000用于计算第M样点的实际样点数据与理论解压后的数据的误差值。
其中,在对压缩进行校验报警时,可以通过控制器进行控制,单独设置一个线程,对样点数据进行缓存,记录样点数据的原值,即实际样点数据,然后,利用控制器对压缩后的数据进行读取、解压缩,与对应的原值进行比较,实现校验报警。
压缩精度判断模块1100用于判断所述误差值是否大于预设阈值。
压缩失真报警模块1200用于在误差值大于预设阈值时发出报警指令。
本实施例提供的地震勘探数据压缩装置,充分考虑了地震勘探仪器系统的等效输入噪声,对样点数据进行整型化处理,然后,利用整数样点数据与其前一整数样点数据的差值表示该样点数据,差值的存储位长为绝对值最大的差值对应的二进制数据位数,以保证所有差值都能进行有效存储的前提下,最大限度减小差值存储所需位长。
通过采用上述装置,将数值较大的采样数据转换为数值较小的差值进行存储,并对差值的存储位长进行优化,能够在不影响地震勘探数据质量的前提下,减少数据存储位数,有效减少地震道数据块所占用的存储空间,进而减少存储成本支出。
本发明实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据。
将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数。
将每组整数样点数据中除第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据。
将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数。
将每组整数样点数据中除第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数。
综上所述,本发明提供的地震勘探数据压缩方法、装置、压缩存储结构、计算机设备以及计算机可读存储介质,充分考虑地震勘探仪器系统的噪声级别,在不影响地震勘探数据质量的前提下,能够减少数据存储位数,有效减少地震道数据块所占用的存储空间,同时减少了节点设备下载数据所需要的时间,提高了生产效率。
其中,本发明具有两种压缩方式,即定长压缩和非定长压缩,有效考虑了相邻样点之间的数据变化趋势,能够充分利用位长,尤其适于节点仪器现场记录和质量控制。
另外,本发明提供的地震勘探数据压缩方法、装置以及压缩存储结构可以直接在地震勘探数据产生的同时进行数据压缩,即对数据流进行压缩存储,适于具有一定逻辑运算功能的实时传输采集系统。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (22)

1.一种地震勘探数据压缩方法,其特征在于,地震勘探数据包括:文件头段、炮头段以及多个地震道数据块,每个地震道数据块包括:道头段以及多个样点数据,地震勘探数据压缩方法包括:
根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;
将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数;
其中,所述根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,包括:
根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声;
根据所述等效输入噪声,选取一比例因数,其中,所述比例因数小于等于所述等效输入噪声,大于地震勘探仪器系统能够分辨的最小输入电压;
将样点数据除以所述比例因数之后,进行四舍五入取整。
2.根据权利要求1所述地震勘探数据压缩方法,其特征在于,还包括:将每组整数样点数据中的第一个整数样点数据转换为预设位长的二进制数据。
3.根据权利要求1所述地震勘探数据压缩方法,其特征在于,还包括:将每组整数样点数据中的第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输。
4.根据权利要求2或3任一项所述地震勘探数据压缩方法,其特征在于,所述将每个地震道数据块中的多个整数样点数据分为N组,包括:
将每个地震道数据块中的多个整数样点数据平均分为N组。
5.根据权利要求2或3任一项所述地震勘探数据压缩方法,其特征在于,所述将每个地震道数据块中的多个整数样点数据分为N组,包括:
将每个整数样点数据与其前一整数样点数据的差值转换为二进制数据;
将二进制数据的位数相差预设范围的整数样点数据分为一组。
6.根据权利要求2或3任一项所述地震勘探数据压缩方法,其特征在于,还包括:
在每个所述地震道数据块的所述道头段之后,插入压缩参数字段。
7.根据权利要求6所述地震勘探数据压缩方法,其特征在于,所述压缩参数字段包括:样点数据单位、压缩单位、分组方式、所述预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长。
8.根据权利要求2或3任一项所述地震勘探数据压缩方法,其特征在于,还包括:
去除第一地震道数据块之后的地震道数据块的道头段中与第一地震道数据块的道头段相比相同的数据。
9.根据权利要求1所述地震勘探数据压缩方法,其特征在于,还包括:
随机读取任一组内第一样点至第M样点对应的M个二进制数据,M小于等于所述组内样点的总数;
将M个二进制数据转换为M个整数数据;
将M个整数数据相加,得到第M样点对应的整数样点数据;
将所述整数样点数据乘以比例因数,得到解压后的数据;
计算第M样点的实际样点数据与所述解压后的数据的误差值;
判断所述误差值是否大于预设阈值;
若是,发出报警指令。
10.根据权利要求1所述地震勘探数据压缩方法,其特征在于,还包括:
随机读取任一组内第一样点至第M样点对应的M个数据,M小于等于所述组内样点的总数;
将M个数据中的二进制数据分别转换为整数数据;
将所述整数数据乘以比例因子,得到对应的解压数据;
将经过处理的M个数据相加,得到第M样点对应的理论解压样点数据;
计算第M样点的实际样点数据与所述理论解压样点数据的误差值;
判断所述误差值是否大于预设阈值;
若是,发出报警指令。
11.一种地震勘探数据压缩装置,其特征在于,地震勘探数据包括:文件头段、炮头段以及多个地震道数据块,每个地震道数据块包括:道头段以及多个样点数据,所述地震勘探数据压缩装置包括:
取整模块,用于根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;
分组模块,用于将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
第一数据压缩模块,将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数;
其中,所述取整模块包括:
噪声识别单元,用于根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声;
比例因数选取单元,用于根据所述等效输入噪声,选取一比例因数,其中,所述比例因数小于等于所述等效输入噪声,大于地震勘探仪器系统能够分辨的最小输入电压;
数据取整单元,用于将样点数据除以所述比例因数之后,进行四舍五入取整。
12.根据权利要求11所述地震勘探数据压缩装置,其特征在于,还包括:
第二数据压缩模块,将每组整数样点数据中的第一个整数样点数据转换为预设位长的二进制数据。
13.根据权利要求11所述地震勘探数据压缩装置,其特征在于,还包括:
数据存储模块,将每组整数样点数据中的第一个整数样点数据按照其对应的样点数据以预设位长进行存储或传输。
14.根据权利要求12或13任一项所述地震勘探数据压缩装置,其特征在于,所述分组模块用于将每个地震道数据块中的多个整数样点数据平均分为N组。
15.根据权利要求12或13任一项所述地震勘探数据压缩装置,其特征在于,所述分组模块包括:
数据转换单元,用于将每个整数样点数据与其前一整数样点数据的差值转换为二进制数据;
数据分组单元,用于将二进制数据的位数相差预设范围的整数样点数据分为一组。
16.根据权利要求12或13任一项所述地震勘探数据压缩装置,其特征在于,还包括:
压缩参数插入模块,用于在每个所述地震道数据块的所述道头段之后,插入压缩参数字段。
17.根据权利要求16所述地震勘探数据压缩装置,其特征在于,所述压缩参数字段包括:样点数据单位、压缩单位、分组方式、所述预设位长、整数样点数据的组数、每组整数样点数据中除第一个整数样点数据之外其他整数样点数据的位长。
18.根据权利要求12或13任一项所述地震勘探数据压缩装置,其特征在于,还包括:
道头压缩模块,用于去除第一地震道数据块之后的地震道数据块的道头段中与第一地震道数据块的道头段相比相同的数据。
19.根据权利要求11所述地震勘探数据压缩装置,其特征在于,还包括:
校验数据读取模块,用于随机读取任一组内第一样点至第M样点对应的M个二进制数据,M小于等于所述组内样点的总数;
校验数据转换模块,用于将M个二进制数据转换为M个整数数据;
校验数据解压模块,用于将M个整数数据相加,得到第M样点对应的整数样点数据;
校验数据还原模块,用于将所述整数样点数据乘以比例因数,得到解压后的数据;
压缩误差计算模块,用于计算第M样点的实际样点数据与所述解压后的数据的误差值;
压缩精度判断模块,用于判断所述误差值是否大于预设阈值;
压缩失真报警模块,用于在误差值大于预设阈值时发出报警指令。
20.根据权利要求11所述地震勘探数据压缩装置,其特征在于,还包括:
校验数据读取模块,用于随机读取任一组内第一样点至第M样点对应的M个数据,M小于等于所述组内样点的总数;
校验数据转换模块,用于将M个数据中的二进制数据转换为整数数据;
校验数据解压模块,用于将所述整数数据乘以比例因子,得到对应的解压数据;
校验数据还原模块,用于将经过处理的M个数据相加,得到第M样点对应的理论解压样点数据;
校验误差计算模块,用于计算第M样点的实际样点数据与所述理论解压样点数据的误差值;
压缩精度判断模块,用于判断所述误差值是否大于预设阈值;
压缩失真报警模块,用于在误差值大于预设阈值时发出报警指令。
21.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;
将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数;
其中,所述根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,包括:
根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声;
根据所述等效输入噪声,选取一比例因数,其中,所述比例因数小于等于所述等效输入噪声,大于地震勘探仪器系统能够分辨的最小输入电压;
将样点数据除以所述比例因数之后,进行四舍五入取整。
22.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以下步骤:
根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,得到整数样点数据;
将每个地震道数据块中的多个整数样点数据顺序分为N组,N为大于等于1的正整数;
将每组整数样点数据中第一个整数样点数据之外的其他各整数样点数据与其前一整数样点数据的差值转换为位长为P的二进制数据,其中,位长P为绝对值最大的差值对应的二进制数据位数;
其中,所述根据地震勘探仪器系统的等效输入噪声对样点数据进行取整,包括:
根据文件头段中的仪器型号和增益,在仪器型号、增益以及等效输入噪声的对应关系表中,查找地震勘探仪器系统的等效输入噪声;
根据所述等效输入噪声,选取一比例因数,其中,所述比例因数小于等于所述等效输入噪声,大于地震勘探仪器系统能够分辨的最小输入电压;
将样点数据除以所述比例因数之后,进行四舍五入取整。
CN201811256396.0A 2018-10-26 2018-10-26 地震勘探数据压缩方法、装置以及压缩存储结构 Active CN109581502B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811256396.0A CN109581502B (zh) 2018-10-26 2018-10-26 地震勘探数据压缩方法、装置以及压缩存储结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811256396.0A CN109581502B (zh) 2018-10-26 2018-10-26 地震勘探数据压缩方法、装置以及压缩存储结构

Publications (2)

Publication Number Publication Date
CN109581502A CN109581502A (zh) 2019-04-05
CN109581502B true CN109581502B (zh) 2020-09-08

Family

ID=65920520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811256396.0A Active CN109581502B (zh) 2018-10-26 2018-10-26 地震勘探数据压缩方法、装置以及压缩存储结构

Country Status (1)

Country Link
CN (1) CN109581502B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732455A (zh) * 2019-10-14 2021-04-30 中国石油化工股份有限公司 一种并行化处理sedg文件道数据的方法
CN110912563A (zh) * 2019-10-24 2020-03-24 北京交通大学 一种针对动力电池的数据压缩优化方法
CN111865324B (zh) * 2019-11-20 2021-08-24 马上消费金融股份有限公司 数据的压缩和解压方法、装置、系统和存储装置
CN112525450B (zh) * 2020-10-26 2022-09-20 中国人民解放军92942部队 一种降低可靠性测试中振动数据存储空间占用率的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130019029A1 (en) * 2011-07-13 2013-01-17 International Business Machines Corporation Lossless compression of a predictive data stream having mixed data types
CN105512120B (zh) * 2014-09-22 2019-06-04 中国石油化工股份有限公司 一种地震数据压缩方法、压缩存储方法及随机访问方法
CN104378118B (zh) * 2014-10-29 2017-08-11 中国科学院地质与地球物理研究所 高效自适应地震数据流无损压缩及解压缩方法
US9660666B1 (en) * 2014-12-22 2017-05-23 EMC IP Holding Company LLC Content-aware lossless compression and decompression of floating point data
CN106019369B (zh) * 2016-06-28 2017-12-22 西南科技大学 一种改进的seg‑y文件中地震数据无损压缩算法

Also Published As

Publication number Publication date
CN109581502A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
CN109581502B (zh) 地震勘探数据压缩方法、装置以及压缩存储结构
CN1268938C (zh) 将可变压缩比用作背景噪声的函数对地震采集进行数据管理
CN103439738B (zh) 地震勘探单炮记录异常道识别方法
CN111562611B (zh) 基于波动方程驱动的半监督深度学习地震数据反演方法
CN105512120B (zh) 一种地震数据压缩方法、压缩存储方法及随机访问方法
CN112180433B (zh) 地震初至波拾取方法及装置
CN104156565A (zh) 基于离线can总线数据的系统状态分析方法及分析装置
CN104737227A (zh) 语音音响编码装置、语音音响解码装置、语音音响编码方法和语音音响解码方法
CN100354931C (zh) 补偿在所接收信号中的线性时间尺度改变的方法和设备
CN103139567A (zh) 一种图像压缩和解压缩的方法和装置
CN109765608B (zh) 一种基于联合字典的煤层巷道锚杆振动噪声压制方法
JP4336745B2 (ja) ダイナミックレンジが広い信号の無損失圧縮方法
CN106199693B (zh) 地震数据速度谱自动拾取方法和装置
CN112464725A (zh) 基于深度学习网络的初至拾取方法及装置
CN111175810B (zh) 微震信号到时拾取方法、装置、设备及存储介质
CN112901146B (zh) 声波测井探测中坏道的识别方法及装置
CN103792570A (zh) 一种地震采集数据的压缩及传输方法
CN110288666B (zh) 一种数据压缩方法及装置
CN112241020B (zh) 稀疏地震数据采集中确定欠采样率的方法和装置
CN103969484A (zh) 高刷新率波形合成器和高刷新率示波器
CN102692459A (zh) 数据压缩的方法及设备
CN106547029B (zh) 一种基于测井资料的线性滑动理论参数反演方法及装置
CN104880732B (zh) 一种十字子集的构建方法及装置
CN106368689B (zh) 一种快速生成测井成像图的方法
CN113672840B (zh) 斯通利波衰减提取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant