CN101839997B - 一种地震数据并行存储系统 - Google Patents

一种地震数据并行存储系统 Download PDF

Info

Publication number
CN101839997B
CN101839997B CN2009100803273A CN200910080327A CN101839997B CN 101839997 B CN101839997 B CN 101839997B CN 2009100803273 A CN2009100803273 A CN 2009100803273A CN 200910080327 A CN200910080327 A CN 200910080327A CN 101839997 B CN101839997 B CN 101839997B
Authority
CN
China
Prior art keywords
storage
level
data
engines
grades
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009100803273A
Other languages
English (en)
Other versions
CN101839997A (zh
Inventor
王堃
穆群英
张宝民
魏启
王浩
朱贵冬
赵培根
张�杰
刘胜航
冯谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Petroleum Corp
BGP Inc
Original Assignee
China National Petroleum Corp
BGP Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China National Petroleum Corp, BGP Inc filed Critical China National Petroleum Corp
Priority to CN2009100803273A priority Critical patent/CN101839997B/zh
Publication of CN101839997A publication Critical patent/CN101839997A/zh
Application granted granted Critical
Publication of CN101839997B publication Critical patent/CN101839997B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种存储地震采集数据的地震数据并行存储系统;由两类部件构成:一类是处理部件,另一类是存储部件,处理部件包括:一级存储引擎、二级存储引擎、三级存储引擎和存储调度器;存储部件包括:一级存储部件、二级存储部件和三级存储部件;一级存储引擎提供存储接口与地震数据采集线程连接,等待地震数据到达;二级存储引擎等待一级存储引擎通知;三级存储引擎等待二级存储引擎通知;存储调度器对地震数据的并行存储过程进行调度;本发明针对地震数据实时存储的需求特点而产生,采用多级缓冲处理、并行存储数据,在保证可靠性的基础上,提高地震数据采集过程中的数据存储效率。

Description

一种地震数据并行存储系统
技术领域
本发明涉及一种存储地震采集数据的地震数据并行存储系统。
背景技术
目前,国际上的地震数据采集系统如法国Sercel公司的408UL地震数据采集系统、美国IO公司的Scorpion地震数据采集系统,均支持多种存储介质的数据保存,如磁盘、磁带机、NAS盘等,数据存储可靠、高效。但是作为商用系统,其整体数据存储技术保密。国内地震领域地震数据采集系统相关存储方法一般采用直接存储、环形缓冲存储或并行存储等方法,而本发明所涉及的基于多级缓冲机制的地震数据并行存储系统首次在我国地震数据采集系统中使用,在国内属于首创。
发明内容
本发明的目的是针对地震数据实时存储的需求特点设计一种基于多级缓冲机制的具有高可靠性和实时性的地震数据并行存储系统。该存储系统在多核/多处理器体系结构基础上,利用线程级并行处理技术,针对地震数据采集过程中所可能使用的特性各异的多种存储介质,采用多级缓冲处理,并行存储数据,在保证可靠性的基础上,提高地震数据采集过程中的数据存储效率。
本地震数据并行存储系统主要由两类部件构成:一类是处理部件,另一类是存储部件。处理部件包括:一级存储引擎、二级存储引擎、三级存储引擎以及存储调度器。存储部件包括:一级存储部件(内存缓冲区)、二级存储部件(内存映射文件)以及三级存储部件(磁带机、NAS盘等目标存储设备)。
在每次地震数据采集的过程中,数据源源不断到达,地震数据采集系统中的地震数据采集线程(是本地震数据并行存储系统的直接交互者,但不属于本发明内容)持续地接收地震数据并存入存储系统(可以理解为一帧一帧地接收数据,一帧一帧地写入存储系统)。由于目标存储设备的写入速度较慢,如果等目标存储设备写入完成一帧后再进行下一帧的接收,那么会严重影响数据的接收,造成数据的丢失。因此,通过提供多级缓冲处理机制,在目标存储设备(三级存储部件)之上提供速度更快的一级存储部件(内存缓冲区),地震数据采集线程在通过一级存储引擎将数据写入一级存储部件之后即可以立刻开始接收下一帧数据,从而大大提高了数据的接收和存储效率。此外,在地震采集过程中,为了提高施工效率,有时需要连续快速放炮。目标存储设备(三级存储部件)的写入速度较慢,如果要等每炮的数据完全写入目标存储设备后才能开始下一炮的采集,则无法实现连续的快速放炮。而一级存储部件使用的是内存缓冲区,容量有限,只靠一级存储部件和二级存储部件也无法实现连续的快速放炮。因此设立了基于内存映射文件的二级存储部件,既可以提供比目标存储设备更高的写入速度,又可以提供足够的容量,从而可以更好的支持连续的快速放炮。
1)一级存储引擎
一级存储引擎的主要功能是将按时间顺序到来的地震数据流进行一定的处理后及时存入一级存储部件。所做的处理工作包括时序道序转换等。
一级存储引擎提供了存储接口。在地震数据采集过程中,地震数据采集线程通过一级存储引擎所提供的存储接口将地震数据存入一级存储部件。由于此过程速度较快,因此地震数据采集线程可以迅速进行后续工作。
2)一级存储部件
一级存储部件的主要功能是按照道序存储地震数据。一级存储部件采用的存储介质是内存,具有较快的读写速度,但容量相对较小,且属于易失性介质。
3)二级存储引擎
二级存储引擎的主要功能是将一级存储部件所存储的道序地震数据取出,按照目标文件格式(SEG-Y、SEG-D等)整理之后,写入二级存储部件。二级存储引擎运行于独立的线程中。
4)二级存储部件
二级存储部件的主要功能是按照目标文件格式存储地震数据。二级存储部件采用的存储介质是硬盘,其读写速度比内存慢,但比目标存储设备快,容量相对较大,数据存储持久。
二级存储部件采用了内存映射文件的方式,将硬盘文件映射到一段内存区域。对内存区域的读写,就相当于对文件的读写,这就大幅提高了二级存储引擎向二级存储部件的写入速度。二级存储引擎写入完成后,可以进行其它后续工作。二级存储部件则利用内存映射文件机制,将内存中的数据交换到硬盘文件。
另外,二级存储部件采用了RAID技术,从硬件层面保证了硬盘数据文件存储的可靠性。
5)三级存储引擎
三级存储引擎的主要功能是将二级存储部件所存储的标准格式数据文件中的数据取出,按照目标存储设备的存储要求进行必要处理后,写入三级存储部件(目标存储设备)。三级存储引擎运行于独立的线程中。
6)三级存储部件
三级存储部件的主要功能是按照目标文件格式存储地震数据。三级存储部件即目标存储设备,通常是磁带机或NAS盘。其读写速度慢,容量很大,数据存储持久。
7)存储调度器
存储调度器的主要功能是对地震数据的并行存储过程进行调度。调度发生在两个方面:一方面是对硬件计算设备资源的分配与调度,另一方面是对各存储引擎的工作调度。
本地震数据并行存储系统所采用的硬件计算设备为多CPU/多核架构的计算设备。存储调度器为各级存储引擎分配硬件计算设备资源。比如:在硬件计算设备资源充足的情况下,为二级存储引擎和三级存储引擎都分配独立的硬件线程(某个CPU内核或某个CPU内核中的某个超线程),这样它们都可以不受限制地获得计算资源。
存储调度器还对各存储引擎的工作进行调度。由于各级存储部件的读写速度差异较大,而各级存储引擎的工作又是异步进行、相对独立,因此读写速度快的部件所存的数据会逐渐积累。数据积累过多的话,一旦系统出现问题,会造成大量数据无法写入目标存储设备。存储调度器会根据一定的策略,对各级存储引擎间的工作步调进行协调,既保持一定程度的异步处理,从而提高系统的存储效率,又能在数据积累较多时进行协调,从而降低因数据积累过多而产生的数据丢失危险。此外,当硬件计算设备资源有限时,各级存储引擎可能运行在同一个硬件线程内。这种情况下,同一时刻只能有一个存储引擎工作。这就需要存储调度器按照数据存储的紧迫性对各级存储引擎的工作进行调度。数据存储的紧迫性按照一级存储引擎、二级存储引擎、三级存储引擎的顺序依次降低。
发明的效果
本发明针对地震数据实时存储的需求特点而产生,采用多级缓冲处理、并行存储数据,在保证可靠性的基础上,提高地震数据采集过程中的数据存储效率,在国内属于首创。目前,本发明已在我国自主研发的地震数据采集系统中使用,从目前的应用效果看,很好地满足了我国自主研发的地震数据采集系统的需求。
附图说明
图1:基本框架结构
图2:一级存储引擎典型工作流程
图3:二级存储引擎典型工作流程
图4:三级存储引擎典型工作流程
具体实施方式
本地震数据并行存储系统主要由两类部件构成:一类是处理部件,另一类是存储部件。处理部件包括:一级存储引擎、二级存储引擎、三级存储引擎以及存储调度器。存储部件包括:一级存储部件(内存缓冲区)、二级存储部件(内存映射文件)以及三级存储部件(磁带机、NAS盘等目标存储设备)。
在地震数据采集过程中,本地震数据并行存储系统的典型工作流程可抽象为以下几组步骤。
1)一级存储引擎典型工作流程
1.1)一级存储引擎等待地震数据到达。
1.2)地震数据按时间顺序到达,地震采集线程通过一级存储引擎提供的存储接口将时序地震数据传给一级存储引擎。
1.3)一级存储引擎对时序地震数据进行一定的处理(时序转道序等)。
1.4)一级存储引擎将处理后的地震数据及时存入一级存储部件。在一级存储部件内,按照道序存储地震数据。
1.5)一级存储引擎通知二级存储引擎,一级存储部件中已有新数据准备好。
1.6)回到1.1)。
2)二级存储引擎典型工作流程
2.1)二级存储引擎等待一级存储引擎通知。
2.2)二级存储引擎收到一级存储引擎的通知,知道一级存储部件中已有新数据准备好。
2.3)二级存储引擎从一级存储部件中取出一定量的道序地震数据。
2.4)二级存储引擎按照目标文件格式(SEG-Y、SEG-D等)整理所取出的地震数据
2.5)二级存储引擎将整理后的地震数据写入二级存储部件。在二级存储部件内,按照目标文件格式存储地震数据。
2.6)二级存储引擎通知三级存储引擎,二级存储部件中已有新数据准备好。
2.7)回到2.1)。
3)三级存储引擎典型工作流程
3.1)三级存储引擎等待二级存储引擎通知。
3.2)三级存储引擎收到二级存储引擎的通知,知道二级存储部件中已有新数据准备好。
3.3)三级存储引擎从二级存储部件中取出一定量的标准格式数据文件中的数据。
3.4)三级存储引擎对取出的地震数据按照目标存储设备的存储要求进行必要处理。
3.5)三级存储引擎将处理后的地震数据写入三级存储部件(目标存储设备)。在三级存储部件内,按照目标文件格式存储地震数据。
3.6)回到3.1)。

Claims (1)

1.一种地震数据并行存储方法,由两类部件构成:一类是处理部件,另一类是存储部件,其特征在于:处理部件包括:一级存储引擎、二级存储引擎、三级存储引擎和存储调度器;存储部件包括:一级存储部件、二级存储部件和三级存储部件;
(1)所述的一级存储引擎工作流程如下:
1.1)一级存储引擎等待地震数据到达;
1.2)当地震数据按时间顺序到达,地震采集线程通过一级存储引擎提供的存储接口将时序地震数据传给一级存储引擎;
1.3)一级存储引擎对时序地震数据进行时序转道序处理;
1.4)一级存储引擎将处理后的地震数据及时存入一级存储部件内存缓冲区,在一级存储部件内,按照道序存储地震数据;
1.5)一级存储引擎通知二级存储引擎,一级存储部件中已有新数据准备好;
1.6)一级存储引擎回到1.1)等待地震数据到达;
一级存储部件采用的存储介质是内存;
(2)所述的二级存储引擎工作流程如下:
2.1)二级存储引擎等待一级存储引擎通知;
2.2)二级存储引擎收到一级存储引擎的通知,知道一级存储部件中已有新数据准备好;
2.3)二级存储引擎从一级存储部件中取出一定量的道序地震数据;
2.4)二级存储引擎按照目标文件格式SEG-Y或SEG-D整理所取出的地震数据;
2.5)二级存储引擎将整理后的地震数据写入二级存储部件;在二级存储部件内,按照目标文件格式存储地震数据;
2.6)二级存储引擎通知三级存储引擎,二级存储部件中已有新数据准备好;
2.7)二级存储引擎回到2.1)等待一级存储引擎通知;
(3)所述的三级存储引擎工作流程如下:
3.1)三级存储引擎等待二级存储引擎通知;
3.2)三级存储引擎收到二级存储引擎的通知,知道二级存储部件中已有新数据准备好;
3.3)三级存储引擎从二级存储部件中取出一定量的标准格式数据文件中的数据;
3.4)三级存储引擎对取出的地震数据按照目标存储设备的存储要求进行必要处理;
3.5)三级存储引擎将处理后的地震数据写入三级存储部件的目标存储设备;在三级存储部件内,按照目标文件格式存储地震数据;
3.6)三级存储引擎回到3.1)等待二级存储引擎通知;三级存储部件是磁带机;
(4)存储调度器
存储调度器对地震数据的并行存储过程进行调度;调度发生在两个方面:一方面是对硬件计算设备资源的分配与调度,在硬件计算设备资源充足的情况下,为二级存储引擎和三级存储引擎都分配独立的硬件线程;另一方面是对各存储引擎的工作调度,既保持一定程度的异步处理,从而提高系统的存储效率,又能在数据积累较多时进行协调,从而降低因数据积累过多而产生的数据丢失危险;当硬件计算设备资源有限时,各级存储引擎有运行在同一个硬件线程内的可能性,这种情况下,需要存储调度器按照数据存储的紧迫性对各级存储引擎的工作进行调度,数据存储的紧迫性按照一级存储引擎、二级存储引擎、三级存储引擎的顺序依次降低。
CN2009100803273A 2009-03-18 2009-03-18 一种地震数据并行存储系统 Active CN101839997B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100803273A CN101839997B (zh) 2009-03-18 2009-03-18 一种地震数据并行存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100803273A CN101839997B (zh) 2009-03-18 2009-03-18 一种地震数据并行存储系统

Publications (2)

Publication Number Publication Date
CN101839997A CN101839997A (zh) 2010-09-22
CN101839997B true CN101839997B (zh) 2012-02-29

Family

ID=42743496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100803273A Active CN101839997B (zh) 2009-03-18 2009-03-18 一种地震数据并行存储系统

Country Status (1)

Country Link
CN (1) CN101839997B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881815A (zh) * 2015-05-28 2015-09-02 中国石油天然气集团公司 一种油藏综合研究中的数据存储处理的方法和系统

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102882902B (zh) * 2011-07-12 2016-09-28 上海可鲁系统软件有限公司 一种工业报文压缩存储方法及装置
CN103369524A (zh) * 2013-07-30 2013-10-23 东莞宇龙通信科技有限公司 终端和数据处理方法
CN104237935B (zh) * 2014-09-28 2017-04-19 北京优科海青技术发展有限公司 用于地球物理勘探的通用数据记录系统架构及其构建方法
CN104570063B (zh) * 2015-02-11 2017-10-10 合肥艾锐存储技术有限公司 一种地震数据的地震道集并行抽取方法
CN106095695A (zh) * 2016-06-06 2016-11-09 中国石油集团川庆钻探工程有限公司地球物理勘探公司 一种基于多核处理器的地震数据快速访问方法
CN107918145B (zh) * 2016-10-10 2020-09-15 中国石油化工股份有限公司 地震炮能量的并行化处理方法及系统
CN107944064B (zh) * 2016-10-12 2020-09-29 中国石油化工股份有限公司 炮属性融合的并行化计算方法及系统
CN109975883B (zh) * 2018-12-25 2021-10-12 中国国土资源航空物探遥感中心 地面磁日变仪数据的自动收录装置
CN111399776B (zh) * 2020-03-13 2020-11-24 西安石油大学 一种基于数据采集的地质勘探管理系统
CN113075733B (zh) * 2021-03-26 2022-03-29 成都理工大学 一种水陆双检的道序质控方法
CN114610233A (zh) * 2022-02-11 2022-06-10 南方海洋科学与工程广东省实验室(广州) 一种高斯窗参数缓冲方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100429526C (zh) * 2005-11-11 2008-10-29 中国石油天然气集团公司 多地震工区数据动态组合处理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100429526C (zh) * 2005-11-11 2008-10-29 中国石油天然气集团公司 多地震工区数据动态组合处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
宋广华等.一种高性能的共享存储多机系统(SMMP) 体系结构——高性能共享存储与高速I/O.《计算机工程与应用》.1998,28-42. *
穆群英等.基于并行处理模型的地震仪器主机系统软件体系结构.《勘探地球物理进展》.2008,第31卷(第6期),454-456. *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881815A (zh) * 2015-05-28 2015-09-02 中国石油天然气集团公司 一种油藏综合研究中的数据存储处理的方法和系统
CN104881815B (zh) * 2015-05-28 2018-04-03 中国石油天然气集团公司 一种油藏综合研究中的数据存储处理的方法和系统

Also Published As

Publication number Publication date
CN101839997A (zh) 2010-09-22

Similar Documents

Publication Publication Date Title
CN101839997B (zh) 一种地震数据并行存储系统
CN101944114B (zh) 内存数据库和物理数据库间的数据同步方法
CN105335513B (zh) 一种分布式文件系统及文件存储方法
CN105446893A (zh) 数据存储方法及设备
CN101739301B (zh) Unix环境下进程间大量数据传输的方法
CN104731799B (zh) 内存数据库管理装置
CN102821164B (zh) 一种高效并行分布式数据处理系统
CN101446966A (zh) 数据存储方法及系统
CN106484329A (zh) 一种基于多级存储的大数据传输完整性保护机制
CN103412889A (zh) 智能电表的数据存储和查询方法及其系统
TW202021313A (zh) 訊息佇列發佈與訂閱之同步方法及其系統
CN101594299A (zh) 基于链表的交换网络中队列缓冲管理方法
CN108881485A (zh) 保障大数据包下的高并发系统响应时间的方法
CN103294413A (zh) 支持海量采集终端的分布式内存实时存储装置及方法
CN104615684A (zh) 一种海量数据通信并发处理方法及系统
CN103729239A (zh) 一种镜像元数据的分布式锁算法
CN110083306A (zh) 一种分布式对象存储系统及存储方法
CN101639763A (zh) 一种io调度方法及调度装置
CN104811646B (zh) 基于连续存储模型的多视频流数据并发调制及缓冲的存储方法
CN102404406A (zh) 基于私有云存储的海洋实时数据同步系统
CN103761262A (zh) 基于syslogd的重复日志控制方法
CN103543959B (zh) 海量数据高速缓存的方法及装置
CN103281383B (zh) 一种面向分布式数据源的时序信息记录方法
CN103324577B (zh) 基于最小化io访问冲突和文件分条的大规模分条文件分配系统
CN106161056B (zh) 周期型数据的分布式缓存运维方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant