CN111737388A - 一种地质图件数据存储处理方法 - Google Patents

一种地质图件数据存储处理方法 Download PDF

Info

Publication number
CN111737388A
CN111737388A CN202010529340.9A CN202010529340A CN111737388A CN 111737388 A CN111737388 A CN 111737388A CN 202010529340 A CN202010529340 A CN 202010529340A CN 111737388 A CN111737388 A CN 111737388A
Authority
CN
China
Prior art keywords
data
geological map
geological
format
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010529340.9A
Other languages
English (en)
Other versions
CN111737388B (zh
Inventor
朱吉军
金刚
李洋
丛丽萍
于波
陈可为
李明彧
王舜智
邹积刚
张忠和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Petrochina Co Ltd
Daqing Oilfield Co Ltd
Original Assignee
Petrochina Co Ltd
Daqing Oilfield Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Petrochina Co Ltd, Daqing Oilfield Co Ltd filed Critical Petrochina Co Ltd
Priority to CN202010529340.9A priority Critical patent/CN111737388B/zh
Publication of CN111737388A publication Critical patent/CN111737388A/zh
Application granted granted Critical
Publication of CN111737388B publication Critical patent/CN111737388B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种地质图件数据存储处理方法,其中,一种地质图件数据存储处理方法,包括:获取地质图件内存数据;根据所述地质图件内存数据进行二进制化处理,得到处理后的地质图件二进制数据;根据所述地质图件二进制数据进行编码处理,得到文本数据格式的地质图件;将所述文本格式的地质图件数据生成为XML格式文件。以解决地质图件的数据文件过大不方便网络传输问题。

Description

一种地质图件数据存储处理方法
技术领域
本发明涉及图像处理领域,具体一种地质图件数据存储处理方法。
背景技术
地质图件是用于绘制描述地壳表层岩相、岩性、地层年代、地质构造、岩浆活动、矿产分布等显示制图区域地质组成及构造特征的专题地图。这类图件的数据多生成为网格数据,即把研究范围分成大小均匀的网格矩阵,将空间上分散的数值转换成规则分布的网格数值,存储的信息可以是点、线、面实体,也可以是其它要素信息。数据网格化已经成为地质图件的主要方式,但其在如今的网络时代存在一些使用不方便的问题:1、地质图件形成的数据文件太大,网络传输不方便。2、地质图件格式多样,可读性差,无法嵌入XML文件。而XML文件是各类网络化应用系统中非常重要的数据交换和传输文件。3、地质图件的存储多为原文件格式存储,不利于共享、不利于规范管理和交换。地质图件的绘制可以使用多种制图软件,如:Geomap、MAPGIS、GPTMap等,绘制完成的文件较大,格式较多。如果将其转换成其它常用格式如JPG、PNG等格式虽然更易于传输,但是会导致图件严重失真,给进行图片的比例变换或绘制修改带来不便。
发明内容
有鉴于此,本发明提供一种地质图件数据存储处理方法,以解决地质图件的数据文件过大不方便网络传输问题。
本发明提供一种地质图件数据存储处理方法,包括:
步骤1:获取地质图件内存数据;
步骤2:根据所述地质图件内存数据进行二进制化处理,得到处理后的地质图件二进制数据;
步骤3:根据所述地质图件二进制数据进行编码处理,得到文本数据格式的地质图件;
步骤4:将所述文本格式的地质图件数据生成为XML格式文件。
优选地,步骤3中所述的编码处理方式为:哈夫曼编码,利用哈夫曼编码将所述地质图件二进制数据转换为文本数据格式的地质图件。
优选地,步骤3中根据所述地质图件二进制数据进行编码处理,得到文本数据格式的地质图件数据之前,还包括:
将所述地质图件二进制数据进行压缩处理,得到压缩的地质图件二进制数据;
所述压缩处理用于降低所述地质图件二进制数据的数据体的大小。
优选地,步骤1中所述地质图件内存数据为:以网格形式存储的地质图件内存数据。
本发明具有如下有益效果:
本发明提供一种地质图件数据存储处理方法,以解决1、地质图件形成的数据文件太大,网络传输不方便。2、地质图件格式多样,可读性差,无法嵌入XML文件。3、地质图件的存储多为原文件格式存储,不利于共享、不利于规范管理和交换问题。
附图说明
通过以下参考附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点更为清楚,在附图中:
图1是本发明实施例一种地质图件数据存储处理方法的流程示意图。
图2是本发明实施例未处理的地质图。
图3是本发明实施例中处理后的文本格式的地质图数据。
在图3中:a1-XML格式文件,a2-XML文件头部位置标注网格数据特征值,a3-生成的XML文件数据体。
具体实施方式
以下基于实施例对本发明进行描述,但是值得说明的是,本发明并不限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。然而,对于没有详尽描述的部分,本领域技术人员也可以完全理解本发明。
此外,本领域普通技术人员应当理解,所提供的附图只是为了说明本发明的目的、特征和优点,附图并不是实际按照比例绘制的。
同时,除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包含但不限于”的含义。
地质图件:是用于绘制描述地壳表层岩相、岩性、地层年代、地质构造、岩浆活动、矿产分布等显示制图区域地质组成及构造特征的专题地图。这类图件的数据多生成为网格数据,即把研究范围分成大小均匀的网格矩阵,将空间上分散的数值转换成规则分布的网格数值,存储的信息可以是点、线、面实体,也可以是其它要素信息。
二进制:在数学和数字电路中指以2为基数的记数系统,以2为基数代表系统是二进位制的。这一系统中,通常用两个不同的符号0(代表零)和1(代表一)来表示 。数字电子电路中,逻辑门的实现直接应用了二进制,因此现代的计算机和依赖计算机的设备里都用到二进制。每个数字称为一个比特(Bit)。
XML:可扩展标记语言,标准通用标记语言的子集,简称XML。是一种用于标记电子文件使其具有结构性的标记语言。在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。
Base64哈夫曼编码:是将任意字节转为可读字符的编码,是一种基于64个可打印字符来表示二进制数据的方法,例如26个英文字母可以表示所有的英文词汇,从而组成英文文章。64个可打印字符集合为大写英文字母A到Z、小写英文字母a到z、阿拉伯数字0到9、还有连接符号+和/,一共 64个可打印字符。Base64哈夫曼编码后的数据就是选用包含64个字符的字符集来表达所有的数据,数据编码后可以嵌入到文本格式的文件当中。而且Base64是可逆的,通过简单的解密就能得到原文。
文本格式:是一种由若干行字符构成的计算机文件。文本文件存在于计算机文件系统中。通常,通过在文本文件最后一行后放置文件结束标志来指明文件的结束。文本文件是指一种容器,而纯文本是指一种内容。文本文件可以包含纯文本。
网格数据:又称格网数据,是指计算机中以栅格结构存贮的内部数据,是扫描式数字化仪的直接产物,适用于屏幕显示和行式打印输出。
图1是本发明实施例一种地质图件数据存储处理方法的流程示意图。图2是本发明实施例未处理的地质图。图3是本发明实施例中处理后的文本格式的地质图数据。如图1、2、3所示,一种地质图件数据存储处理方法,包括:步骤1:获取地质图件内存数据。步骤2:根据所述地质图件内存数据进行二进制化处理,得到处理后的地质图件二进制数据。步骤3:根据所述地质图件二进制数据进行编码处理,得到文本数据格式的地质图件。步骤4:将所述文本格式的地质图件数据生成为XML格式文件a1。
在本发明实施例中,在地质图件制图软件中,可以将绘制完成的地质图件进行整张图保存或分区域保存,地质图绘图软件种类繁多,如:Resform、GPTMap、GeoMap等,生成的文件格式多样,如:.wlp、.scg、.gdb等,但无论何种格式的地质图件存储在计算机内存中,读取时都可以以网格数据形式进行读取,本方法适用于所有格式的地质图件的格式处理。
在本发明实施例中,将地质图件转换为地质图件二进制数据。二进制转换时采用编程语言为Microsoft Visual C++(简称Visual C++、MSVC、VC++6.0或VC6.0,面向对象的可视化集成编程系统)编程语言实现。
地质图件二进制转换方式为:在系统中自定义StructuredGrid类,用于设置结构化网格数据对象,读取存储在计算机内存中的地质图件图形数据。类属性主要包括:xCellCont,数据在X方向的网格数。yCellCont,数据在Y方向的网格数。xIndex,设置点的X索引。yIndex,设置点的Y索引。zValue,设置点的值。类属性是描述类的所有对象共同特征的一个数据项,对于任何对象实例,它的属性是相同的。
在系统中自定义BinaryBlockConvertor类,用于将读取的结构化网格数据进行二进制格式转化,生成二进制数据流块。类属性主要包括,row行数,col列数,xminX最小值,yminY最小值,dxX间隔,dyY间隔,zminZ最小值,zmaxZ最大值,gridZ数值数据体。
在系统中自定义MemoryStrem类,用于临时存储生成的二进制数据流块。计算机内存中的数据类型有int(整型),float(单精度浮点型),double(双精度浮点型),boolean(逻辑函数)等多种类型,占用的内存字节各不相同。数据类型指的是用于声明不同类型的变量或函数的一个广泛的系统,变量的类型决定了变量存储占用的空间,以及如何解释存储的位模式。MemoryStrem类定义了一个数组元素长度是8位的可变长度数组,用于将输入的数据按照单字节进行存储,从而实现数据的二进制转化。
按照定义的StructuredGrid类设置实例化对象,依次读取地质平面图指定位置开始的点的数据,获得网格数据。然后再调用定义的BinaryBlockConvertor类的方法,将网格数据转化为二进制数据流块,将二进制数据流块输入定义的MemoryStrem类,将其存储为数组元素为单字节的数组,从而完成将该地质图件数据转换为地质图件二进制格式数据目的。
在本发明及图1中,步骤3中的编码处理为:利用哈夫曼编码方式,将所述地质图件二进制数据转换为文本数据格式的地质图件。
在本发明实施例中,处理后的地质图件二进制数据使用Base 64哈夫曼编码方法将步骤2生成的压缩数据进行编码,将其转换为文本数据格式。
在本发明实施例中,文本格式数据文件为XML格式文件,XML数据文件是一种文本格式的文件,广泛用于网络传输,数据交换等领域。XML数据以纯文本格式存储,这使得XML更易读、记录、索引,更便于调试,使不同系统、不同程序之间的数据共享变得更加简单。
步骤4中将编码完成的地质图件二进制数据转换为XML格式文件a1方法为,调用windows系统类库中的XmlwriterSetting类,用于实现输出XML文件的方法。命名空间System.Xml,继承层次结构System.Object,System.Xml.XmlWriterSettings。使用XmlwriterSetting类中的Creat方法创建XML文件,由于XML文件是由节点构成的,还需使用使用XmlwriterSetting类中的WriteStartElement方法创建XML标识节点,使用XmlwriterSetting类中的WriteAttributeString方法输入节点名称和属性值。
在生成XML文件时,需要在文件头部位置标注网格数据特征值a2,这些特征值是进行二进制转化和base64哈夫曼编码时产生的记录,在生成XML文件时,将这些记录作为特征值写入xml文件的头部,包括但不限于[行数]、[列数]、[x最小值]、[y最小值]、[x间隔]、[y间隔]、[z最小值]、[z最大值]和[压缩算法类型]等。以便于在进行还原操作时,按照这些特征值进行反顺序操作,即可还原出原始的地质图件数据。
在本发明及图1中,在所述根据所述地质图件二进制数据进行编码处理,得到文本数据格式的地质图件数据之前,还包括:根据所述地质图件二进制数据进行压缩处理,得到压缩的地质图件二进制数据;所述压缩处理用于降低所述地质图件二进制数据的数据体的大小。
在本发明实施例中,可以使用gzip、zlib或者HDF5等现有压缩算法,将生成地质图件二进制数据进行压缩。适用于本实施例的压缩算法并不限于上述三种,可以根据需要选择具体的压缩算法。地质图件二进制数据压缩后,变成了一种加密后的二进制数据。压缩过后的二进制数据的数据体更小,节省磁盘空间的同时,使得转换文本格式时更加快速方便。
在本发明及图1中,所述地质图件内存数据为以网格形式存储的地质图件内存数据。目前主流的地质图件是以网格数据的形式进行存储,本发明不限于网格数据形式存储的地质图件,其处理方法与网格数据处理方法相同,皆为从系统内存中读取存储的内容进行格式的转换。
本发明的具体实施方式为,在计算机程序中绘制地质图件,将地质图件保存在计算机系统内存中。在计算机系统中定义并运行StructuredGrid类,用来获取计算机内存中的地质图件数据,并存储在类属性中。通过定义并运行BinaryBlockConvertor类,将地质图数据进行二进制格式转化。通过定义并运行MemoryStrem类来存储转化后的二进制数据。将转化后的二进制数据选择一种压缩算法将其压缩,减小其数据体大小。采用Base64哈夫曼编码将二进制格式地质图数据转换为文本格式。最后调用windows系统类库中的XmlwriterSetting类将文本文件格式转换为XML格式文件a1,XML格式文件a1中包含文件头部位置标注网格数据特征值a2和生成的XML文件数据体a3。转换完成的XML格式地质图数据文件可以通过上述反向操作来进行还原成原本的数据格式,即:将XML格式地质图文件通过Base64哈夫曼编码转换为二进制数据文件,再将二进制数据文件按照原来选择压缩算法进行解压缩,在计算机系统中创建新的类,用于执行反向操作,将解压完成后的地质图二进制数据还原成原本的格式,也可以通过将StructuredGrid类、BinaryBlockConvertor类、MemoryStrem类设置成为能够反向操作的类,则可以不用设置新的类来进行操作。解压完成后的二进制数据需根据XML文件头部位置标注网格数据特征值a2还原成原本的地质图数据格式。
本发明可广泛应用于各种地质绘图软件的升级优化,改进其数据存储方法。例如绘制地质平面图(构造图、等值线图、沉积相图等),剖面图(地质剖面图、测井曲线图、地震剖面图、岩性柱状图、连井剖面图等)、统计图、地理图等,XML格式文件易于在任何应用程序中读/写数据或在网络上传输。
以上所述实施例仅为表达本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形、同等替换、改进等,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (4)

1.一种地质图件数据存储处理方法,其特征在于,包括:
步骤1:获取地质图件内存数据;
步骤2:根据所述地质图件内存数据进行二进制化处理,得到处理后的地质图件二进制数据;
步骤3:根据所述地质图件二进制数据进行编码处理,得到文本数据格式的地质图件;
步骤4:将所述文本格式的地质图件数据生成为XML格式文件。
2.根据权利要求1所述地质图件数据存储处理方法,其特征在于,步骤3中所述的编码处理方式为:哈夫曼编码,利用哈夫曼编码将所述地质图件二进制数据转换为文本数据格式的地质图件。
3.根据权利要求1或2所述地质图件数据存储处理方法,其特征在于,步骤3中根据所述地质图件二进制数据进行编码处理,得到文本数据格式的地质图件数据之前,还包括:
将所述地质图件二进制数据进行压缩处理,得到压缩的地质图件二进制数据;
所述压缩处理用于降低所述地质图件二进制数据的数据体的大小。
4.根据权利要求1所述地质图件数据存储处理方法,其特征在于,步骤1中所述地质图件内存数据为:以网格形式存储的地质图件内存数据。
CN202010529340.9A 2020-06-11 2020-06-11 一种地质图件数据存储处理方法 Active CN111737388B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010529340.9A CN111737388B (zh) 2020-06-11 2020-06-11 一种地质图件数据存储处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010529340.9A CN111737388B (zh) 2020-06-11 2020-06-11 一种地质图件数据存储处理方法

Publications (2)

Publication Number Publication Date
CN111737388A true CN111737388A (zh) 2020-10-02
CN111737388B CN111737388B (zh) 2024-01-30

Family

ID=72648732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010529340.9A Active CN111737388B (zh) 2020-06-11 2020-06-11 一种地质图件数据存储处理方法

Country Status (1)

Country Link
CN (1) CN111737388B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101860533A (zh) * 2010-05-26 2010-10-13 卓望数码技术(深圳)有限公司 一种基于c/s架构浏览器的数据传输方法及服务器
CN103731154A (zh) * 2013-11-01 2014-04-16 陕西理工学院 一种基于语义分析的数据压缩算法
CN105282124A (zh) * 2014-07-24 2016-01-27 上海未来宽带技术股份有限公司 基于xmpp协议的渐进式图片的传输方法及呈现方法
US20160299057A1 (en) * 2013-11-15 2016-10-13 Mikroscan Technologies, Inc. Geological scanner
CN111260784A (zh) * 2020-01-20 2020-06-09 广州海格星航信息科技有限公司 一种城市三维空间网格压缩编码方法、装置及终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101860533A (zh) * 2010-05-26 2010-10-13 卓望数码技术(深圳)有限公司 一种基于c/s架构浏览器的数据传输方法及服务器
CN103731154A (zh) * 2013-11-01 2014-04-16 陕西理工学院 一种基于语义分析的数据压缩算法
US20160299057A1 (en) * 2013-11-15 2016-10-13 Mikroscan Technologies, Inc. Geological scanner
CN105282124A (zh) * 2014-07-24 2016-01-27 上海未来宽带技术股份有限公司 基于xmpp协议的渐进式图片的传输方法及呈现方法
CN111260784A (zh) * 2020-01-20 2020-06-09 广州海格星航信息科技有限公司 一种城市三维空间网格压缩编码方法、装置及终端设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
冯俊杰等: "自动调流式滴头的内部流场数值模拟", 《节水灌溉》, no. 09, pages 88 - 93 *
田宜平等: "地学三维可视化与过程模拟", 《武汉:中国地质大学出版社》, pages: 97 - 102 *
高立: "基于网络数据库技术下的常州地区地下水流数值模拟", 《中国优秀硕士学位论文全文数据库基础科学辑》, no. 03, pages 011 - 132 *

Also Published As

Publication number Publication date
CN111737388B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
US9390110B2 (en) Method and apparatus for compressing three-dimensional point cloud data
US11132540B2 (en) Ink file searching method, apparatus, and program
US8117217B2 (en) Information processing apparatus and encoding method
US7958133B2 (en) Application conversion of source data
Mellor et al. Migration on request, a practical technique for preservation
CN111639473A (zh) 基于java的excel文件解析方法、装置、计算机设备及存储介质
US20030122694A1 (en) Variable length encoding and decoding of ascending numerical sequences
CN106776498A (zh) 一种数据导出为pdf的方法
US10437825B2 (en) Optimized data condenser and method
CN111737388B (zh) 一种地质图件数据存储处理方法
JP6387207B1 (ja) デジタルインクの符号化方法、復号化方法
CN114722781A (zh) 一种将流式文档转换为ofd文档的方法和装置
CN111324587A (zh) Obj文件的数据的压缩方法、解析方法以及系统
Maleika et al. Lossless compression method for digital terrain model of seabed shape
EP3696704B1 (en) Synthetic data generation apparatus, method for the same, and program
CN115001628B (zh) 数据编码的方法及装置、数据解码的方法及装置和数据结构
CN116257488B (zh) 岩土工程勘察大数据归档方法、装置、电子设备及介质
PEUQUET Methods for Structuring Digital Cartographic Data in a Personal Computer Environment
Keshari et al. Streaming-archival inkml conversion
Patil et al. A Byte Transformation Technique for Lossy Image Compression
Westhead et al. Representing Scientific Data on the Grid with BinX–Binary XML Description Language
Gupta et al. Index Optimization Using Wavelet Tree and Compression
Ji Research on Compression Methods for ASCII STL File
CN117807036A (zh) 一种文件导入导出方法、系统及计算机存储介质
CN114070325A (zh) 一种文本数据的压缩方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant