CN104537125B - 一种基于消息传递接口的遥感影像金字塔并行构建方法 - Google Patents

一种基于消息传递接口的遥感影像金字塔并行构建方法 Download PDF

Info

Publication number
CN104537125B
CN104537125B CN201510043708.XA CN201510043708A CN104537125B CN 104537125 B CN104537125 B CN 104537125B CN 201510043708 A CN201510043708 A CN 201510043708A CN 104537125 B CN104537125 B CN 104537125B
Authority
CN
China
Prior art keywords
pyramid
remote sensing
data
sensing image
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510043708.XA
Other languages
English (en)
Other versions
CN104537125A (zh
Inventor
熊伟
赫高进
陈荦
吴秋云
景宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201510043708.XA priority Critical patent/CN104537125B/zh
Publication of CN104537125A publication Critical patent/CN104537125A/zh
Application granted granted Critical
Publication of CN104537125B publication Critical patent/CN104537125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files

Abstract

本发明提供一种基于消息传递接口的遥感影像金字塔并行构建方法。技术方案包括下述步骤:第一步:设置金字塔级数和进程个数,并设定主进程;第二步:主进程读取遥感影像的元数据信息;第三步:创建金字塔文件;第四步:数据划分:主进程将遥感影像的当前处理波段数据平均划分给各个进程。第五步:读取数据:各个进程并行读取各自划分到的数据;第六步:重采样:各个进程采用重采样算法对所要处理的遥感影像数据进行当前金字塔级数对应粒度的重采样;第七步:并行写出结果:各个进程将内存中的重采样后的结果并行写入金字塔文件。本发明构建金字塔效率高,提高了数据写出效率。

Description

一种基于消息传递接口的遥感影像金字塔并行构建方法
技术领域
本发明属于地理信息处理技术领域,涉及一种地理信息系统中大规模遥感影像金字塔的构建方法。
背景技术
随着遥感数据获取技术的快速发展,遥感影像的空间和时间分辨率都大幅度地提高,单幅遥感影像文件的数据量也急剧增加。对于大规模遥感影像进行快速显示和服务发布时,通过预先构建金字塔是提高可视化和服务性能的有效手段,但大数据量为金字塔的构建效率带来了巨大挑战。传统串行的方式由于构建时间很长,已无法与数据获取的速度相匹配,远远不能满足实际应用需求。如何对大数据量遥感影像快速构建金字塔成为一个亟待解决的问题。在此背景下,采用多处理器、多节点的集群计算环境和并行处理机制构建金字塔成为必然趋势。
金字塔结构用于实现遥感影像的多分辨率组织。简单来说,金字塔结构就是由原始遥感影像开始,建立起一系列不同分辨率的遥感影像,不同分辨率的遥感影像对应不同的金字塔级。同时,金字塔也是遥感影像的一种有损压缩方式。构建金字塔以后,可以改善遥感影像显示性能,当用户需要对遥感影像进行不同分辨率地放大、缩小或平移时,通过选择一个与用户视图相近分辨率的数据进行可视化,从而系统只需进行少量的计算和查询就可以返回结果,不需要进行逐级采样计算,大大减少数据显示时间。
并行构建金字塔主要有两种思路。一种是基于GPU(Graphic Processing Unit,图形处理单元)进行并行加速,利用GPU的计算能力加快金字塔的构建速度,这种方法与GPU硬件能力相关,会提高系统架构的成本;另一种是利用分布式集群系统,将大规模遥感影像文件的金字塔构建任务划分为多个子任务,在多个分布式节点上同时进行。这种方法扩展性较好,可以充分利用分布式并行环境来处理大规模数据,但需要将遥感影像分布存储在多个节点。目前,利用共享外存的高性能集群,基于MPI(Message Passing Interface,消息传递接口)进行大规模遥感影像金字塔的并行构建研究较少。
发明内容
本发明的目的提供一种基于新思路的遥感影像金字塔并行构建方法。本发明不需利用GPU,而是利用共享外存的高性能集群,实现对遥感影像并行重采样,然后将重采样结果并行写入到文件系统中,形成遥感影像金字塔。
本发明的技术解决方案为:一种基于消息传递接口的遥感影像金字塔并行构建方法,金字塔级数越大分辨率越低。步骤如下:
第一步:设置金字塔级数和进程个数
根据实际需要设定金字塔级数和进程个数,并设定零号进程作为主进程;
第二步:读取遥感影像的元数据信息
主进程读取遥感影像的元数据信息。
第三步:创建金字塔文件
主进程根据设定的金字塔级数和遥感影像的元数据信息计算待创建的金字塔文件大小,如果金字塔文件不超过4GB,则创建GeoTIFF(Georeferenced Tagged Image FileFormat,地理参考标签影像文件格式)格式的金字塔文件,该金字塔文件只包含相应的元数据信息;如果金字塔文件大小超过4GB,则创建BigTIFF(Big Tagged Image File Format,大规模标签影像文件格式)格式的金字塔文件,该金字塔文件同样只包含相应的元数据信息。
对遥感影像的每一个波段进行下述处理,即包括第四步至第七步的处理:
第四步:数据划分
主进程根据元数据信息,按照行划分的方式对遥感影像的当前处理波段数据根据数据量平均划分给各个进程,并通知各个进程读取各自划分到的数据。
第五步:读取数据
各个进程根据各自划分到的数据情况,计算在原始遥感影像文件中的数据偏移,将所要处理的遥感影像数据读入内存,各个进程读取数据的过程并行地进行。
设当前金字塔级数为0级,然后进行下述步骤:
第六步:重采样
各个进程采用重采样算法对所要处理的遥感影像数据进行当前金字塔级数对应粒度的重采样,将重采样后的结果缓存在内存中,准备写入到金字塔文件,各个进程重采样操作并行地进行。
第七步:并行写出结果
各个进程计算第六步缓存在内存中的重采样结果在金字塔文件中放置的偏移量,将内存中的重采样后的结果并行写入金字塔文件。
将当前金字塔级数加1,如果当前金字塔级数小于设定金字塔级数,则返回第六步;如果当前金字塔级数不小于设定金字塔级数,则结束当前处理波段的处理。
本发明的有益效果是:
(1)本发明所生成的遥感影像金字塔文件与地理空间数据抽象库GDAL(Geospatial Data Abstract Library,地理数据抽象库)生成的金字塔文件格式一致,GDAL是一种被广泛应用的金字塔构建工具,其创建的金字塔文件能够被当前绝大多数地理信息系统软件直接使用,可以无缝集成到各种地理信息应用中。
(2)本发明构建金字塔效率高。除了在主进程创建金字塔文件时,各个进程需要等待外,在重采样和数据并行读写过程中,各个进程完全并行。而且,由于创建的金字塔文件中只包含数据量很小的元数据信息,进程等待时间相对于金字塔构建时间较少。
(3)本发明数据写出效率高。各个进程在重采样完成后,并行写出重采样结果数据,提高了数据写出效率。
附图说明
图1是本发明的流程示意图;
图2是本发明并行构建金字塔时数据划分和重采样的示意图;
图3是GDAL算法与本发明方法对不同类型遥感影像构建金字塔的性能对比;
图4是本发明方法构建金字塔时执行时间随处理进程数目变化情况。
具体实施方式
结合附图对本发明作进一步描述。
图1为本发明流程示意图。假设设定N个进程参与金字塔并行构建,分别为P0,P1,…,PN-1,其中P0为零号进程作为主进程。输入参数除进程个数N以外,还有金字塔级数K,即最后输出为包含L0,L1,…,LK-1级金字塔数据的文件。主进程从输入遥感影像文件F中读取元数据信息(包括波段数、行数、列数、数据类型、多波段数据分布方式、颜色表信息)。假设元数据信息的大小为M字节,遥感影像文件F中除去元数据信息后遥感影像数据大小为D字节,金字塔文件大小则为字节。主进程P0根据金字塔级数,设置金字塔文件元数据信息,调用GDAL创建金字塔文件。这一步创建的金字塔文件不包含实际的金字塔采样数据,只包含对金字塔文件进行描述的元数据信息,因此耗时较少。各个进程等待主进程P0创建完空白的金字塔文件后,对每一个波段进行数据划分,将数据基本平均地划分给每个进程(包括主进程),使每个进程处理的数据量基本相等,每个进程并行地进行数据读取,重采样以及写出操作。具体过程如下:各个进程计算划分到的要处理的数据在遥感影像文件F中的偏移量,并从输入遥感影像文件F将实际数据(即不包括元数据)读取到内存中,然后根据重采样算法(如:最近邻算法、立方卷积算法、线性插值算法)进行重采样,将重采样的结果保存在内存中。然后,各个进程计算数据在金字塔文件中的偏移量,再将内存中数据写入到金字塔文件中。不同级的金字塔重采样数据量不一样,在文件中的偏移量也会发生变化,因此重复以上重采样、写入操作直到金字塔构建完成。本发明流程执行过程中,需对输入遥感影像数据进行多次重采样,但只需对遥感影像文件F进行一次读取,减少了读/写操作。
图2是本发明并行构建金字塔时数据划分和重采样的示意图。假设共有N个进程(分别为P0,P1,…,Pi,…,PN-1)参与K级金字塔的并行构建,P0为主进程。遥感影像为3波段,每个波段数据宽为XSize像素,高为YSize像素。数据划分采用行划分的方式,每个进程划分到的行数尽可能相等,当进程i满足0≤i<N-1时,进程Pi处理数据宽为XSize像素,高为像素,进程PN-1处理的数据宽为XSize像素,高为像素。由于不同金字塔级对原始数据的采样尺度不同,因此各级金字塔的数据量大小也不相同,第j(j=0,1,…,K-1)级金字塔数据量宽为像素,高为像素,每个进程需要重采样K次,分别写入金字塔文件中相应的位置。写入的位置距文件起始位置偏移量按如下方法计算:金字塔文件由多个目录组成,每个目录对应金字塔的一级,进程在将重采样的数据写入金字塔文件时,首先读取对应的目录,再根据该进程所处理的数据范围,获取重采样后的数据条带距金字塔文件起始位置的偏移量。如果输入影像有多个波段,则重采样数据按照“波段1波段2波段3”的方式存储。图2中,空白的小方块表示波段1(band1)存储的数据,实心的小方块表示波段2(band2)存储的数据,画斜线的小方块表示波段3(band3)存储的数据。
图3是本文并行构建算法与GDAL的构建算法对比图。所采用遥感影像数据为d1、d2、d3、d4,其中数据d1:宽44800像素,高36864像素,1波段,大小1.6GB;数据d2:宽42040像素,高58368像素,3波段,大小4.8GB;数据d3:宽77312像素,高99328像素,1波段,大小7.2GB;数据d4:宽87040像素,高58368像素,3波段,大小15GB。并行构建金字塔算法使用N=32个进程。图中的纵坐标中,空白矩形的高度表示GDAL算法耗时,实心矩形的高度表示本发明耗时,从图中可以看到,采用本发明方法构建金字塔的速度比GDAL有很大提升。
图4是对遥感影像数据d2采用不同数目进程并行构建金字塔的时间变化情况。横坐标是进程数,纵坐标是算法执行时间。从图中可以看到,随着进程数目增加,算法执行时间相应减少,当进程数目增加到一定程度时,算法执行时间趋于稳定。这是因为,当进程数较少时,随着进程增加,单个进程所处理的数据量减少,且各个进程并行地进行采样和写入数据,因此算法总时间减少。当进程增加到一定数目时,进程调度、网络通信及其他系统开销相应增加,抵消了进程数目增加带来的性能提升,因此算法执行时间逐渐趋于稳定。从图中可以看到,该方法针对数据d2构建金字塔时,在进程数达到48个时算法执行时间趋于稳定,在此之前执行时间随进程数目增加而减少,表明该方法具有良好的扩展性。

Claims (1)

1.一种基于消息传递接口的遥感影像金字塔并行构建方法,金字塔级数越大分辨率越低,其特征在于,包括下述步骤:
第一步:设置金字塔级数和进程个数:
根据实际需要设定金字塔级数和进程个数,并设定零号进程作为主进程;
第二步:读取遥感影像的元数据信息:
主进程读取遥感影像的元数据信息;
第三步:创建金字塔文件:
主进程根据设定的金字塔级数和遥感影像的元数据信息计算待创建的金字塔文件大小,如果金字塔文件不超过4GB,则创建地理参考标签影像文件格式的金字塔文件,该金字塔文件只包含相应的元数据信息;如果金字塔文件大小超过4GB,则创建大规模标签影像文件格式的金字塔文件,该金字塔文件同样只包含相应的元数据信息;
对遥感影像的每一个波段进行下述处理,即包括第四步至第七步的处理:
第四步:数据划分:
主进程根据遥感影像的元数据信息,按照行划分的方式对遥感影像的当前处理波段数据根据数据量平均划分给各个进程,并通知各个进程读取各自划分到的数据;
第五步:读取数据:
各个进程根据各自划分到的数据情况,计算在原始遥感影像文件中的数据偏移,将所要处理的遥感影像数据读入内存,各个进程读取数据的过程并行地进行;
设当前金字塔级数为0级,然后进行下述步骤:
第六步:重采样:
各个进程采用重采样算法对所要处理的遥感影像数据进行当前金字塔级数对应粒度的重采样,将重采样后的结果缓存在内存中,各个进程重采样操作并行地进行;
第七步:并行写出结果:
各个进程计算第六步缓存在内存中的重采样结果在金字塔文件中放置的偏移量,将内存中的重采样后的结果并行写入金字塔文件;
将当前金字塔级数加1,如果当前金字塔级数小于设定金字塔级数,则返回第六步;如果当前金字塔级数不小于设定金字塔级数,则结束当前处理波段的处理。
CN201510043708.XA 2015-01-28 2015-01-28 一种基于消息传递接口的遥感影像金字塔并行构建方法 Active CN104537125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510043708.XA CN104537125B (zh) 2015-01-28 2015-01-28 一种基于消息传递接口的遥感影像金字塔并行构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510043708.XA CN104537125B (zh) 2015-01-28 2015-01-28 一种基于消息传递接口的遥感影像金字塔并行构建方法

Publications (2)

Publication Number Publication Date
CN104537125A CN104537125A (zh) 2015-04-22
CN104537125B true CN104537125B (zh) 2017-11-14

Family

ID=52852653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510043708.XA Active CN104537125B (zh) 2015-01-28 2015-01-28 一种基于消息传递接口的遥感影像金字塔并行构建方法

Country Status (1)

Country Link
CN (1) CN104537125B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677488B (zh) * 2016-01-12 2019-05-17 中国人民解放军国防科学技术大学 一种混合并行方式栅格影像金字塔构建方法
CN105550977B (zh) * 2016-01-29 2018-12-28 中国人民解放军国防科学技术大学 一种并行方式栅格影像切片方法
CN110780842A (zh) * 2019-10-25 2020-02-11 无锡恒鼎超级计算中心有限公司 基于神威架构的船舶三维声弹性模拟计算的并行优化方法
CN112233011A (zh) * 2020-10-22 2021-01-15 中国科学院空天信息创新研究院 一种遥感图像的内存组织与处理方法及装置
CN112561832B (zh) * 2020-12-24 2023-12-01 山东省国土测绘院 一种遥感影像数据存储方法及系统
CN116755636B (zh) * 2023-08-16 2023-10-27 中国空气动力研究与发展中心计算空气动力研究所 一种网格文件的并行读入方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315424A (zh) * 2008-07-29 2008-12-03 中国科学院对地观测与数字地球科学中心 多卫星遥感数据一体化并行地面预处理系统
CN101706950A (zh) * 2009-07-13 2010-05-12 中国科学院遥感应用研究所 一种遥感影像多尺度分割的高性能实现方法
CN101799762A (zh) * 2010-04-07 2010-08-11 中国科学院对地观测与数字地球科学中心 面向遥感图像处理算法的快速并行化编程模板方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140130056A1 (en) * 2012-11-05 2014-05-08 Rational Systems Llc Parallel Execution Framework

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315424A (zh) * 2008-07-29 2008-12-03 中国科学院对地观测与数字地球科学中心 多卫星遥感数据一体化并行地面预处理系统
CN101706950A (zh) * 2009-07-13 2010-05-12 中国科学院遥感应用研究所 一种遥感影像多尺度分割的高性能实现方法
CN101799762A (zh) * 2010-04-07 2010-08-11 中国科学院对地观测与数字地球科学中心 面向遥感图像处理算法的快速并行化编程模板方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于MPI并行的遥感影像系统级几何校正快速处理技术研究;李宏宽等;《河南工程学院学报(自然科学版)》;20110331;第23卷(第1期);第49-52页 *
遥感影像剖分金字塔研究;程承旗等;《地理与地理信息科学》;20100131;第26卷(第1期);第19-23页 *

Also Published As

Publication number Publication date
CN104537125A (zh) 2015-04-22

Similar Documents

Publication Publication Date Title
CN104537125B (zh) 一种基于消息传递接口的遥感影像金字塔并行构建方法
JP6977239B2 (ja) 行列乗算器
US20200356500A1 (en) Data processing performance enhancement for neural networks using a virtualized data iterator
US9122700B2 (en) Parallel log structured file system collective buffering to achieve a compact representation of scientific and/or dimensional data
TWI537870B (zh) 多重解析度一致性光柵化
US8612491B2 (en) System and method for storing a dataset of image tiles
US20190318231A1 (en) Method for acceleration of a neural network model of an electronic euqipment and a device thereof related appliction information
US10769749B2 (en) Processor, information processing apparatus, and operation method of processor
CN110178149A (zh) 数字双胞胎图
CN101833780B (zh) 一种基于游程表达和运算的地图成图方法
TWI633516B (zh) 曲面細分及幾何著色器的功率效率屬性處理
CN107544948B (zh) 一种基于MapReduce的矢量文件转换方法和装置
CN103761291A (zh) 一种基于聚合请求的地理栅格数据并行读写方法
US10699427B2 (en) Method and apparatus for obtaining sampled positions of texturing operations
CN105550977A (zh) 一种并行方式栅格影像切片方法
Ponto et al. Giga-stack: A method for visualizing giga-pixel layered imagery on massively tiled displays
CN104750937B (zh) 基于Hadoop的集成电路版图转换方法
WO2019147441A1 (en) Wide key hash table for a graphics processing unit
CN103645873A (zh) 一种在趋势曲线系统中实现高效数据缓存的方法
CN103218493B (zh) 一种基于多重网格的快速等几何分析数值模拟方法
CN103678888A (zh) 一种基于欧拉流体模拟算法的心脏血液流动示意显示方法
Fratarcangeli et al. A gpu-based implementation of position based dynamics for interactive deformable bodies
Marques et al. A cloud computing based framework for general 2D and 3D cellular automata simulation
Hsieh et al. Parallel tsunami simulation and visualization on tiled display wall using OpenGL Shading Language
JP7427120B2 (ja) 特徴画像の処理方法、装置及び記憶媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant