CN118037870B - 一种兼容Zdepth的并行化深度图像压缩算法、装置及终端设备 - Google Patents
一种兼容Zdepth的并行化深度图像压缩算法、装置及终端设备 Download PDFInfo
- Publication number
- CN118037870B CN118037870B CN202410412342.8A CN202410412342A CN118037870B CN 118037870 B CN118037870 B CN 118037870B CN 202410412342 A CN202410412342 A CN 202410412342A CN 118037870 B CN118037870 B CN 118037870B
- Authority
- CN
- China
- Prior art keywords
- data
- compression
- algorithm
- zero
- depth image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007906 compression Methods 0.000 title claims abstract description 95
- 230000006835 compression Effects 0.000 title claims abstract description 95
- 238000012545 processing Methods 0.000 claims abstract description 32
- 238000013139 quantization Methods 0.000 claims abstract description 20
- 230000015654 memory Effects 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000013144 data compression Methods 0.000 claims description 6
- 238000004806 packaging method and process Methods 0.000 claims description 6
- 238000012856 packing Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000003672 processing method Methods 0.000 claims description 3
- 230000006837 decompression Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000005291 magnetic effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/001—Model-based coding, e.g. wire frame
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明属于图像处理技术领域,公开了一种兼容Zdepth的并行化深度图像压缩算法,s1采集深度图像进行预处理后准备进行s2量化处理,经过s2量化处理,图像数据被简化为较少的比特表示,随即进入s3零压缩阶段,系统识别并压缩量化后数据中的连续零值,进一步减少数据的存储需求,完成s3零值的压缩处理后,数据将进入s4预测分块压缩阶段,系统通过分析每个数据块内的像素关系,进行进一步压缩数据,s5数据输出,将所有压缩后的数据通过ZSTD算法压缩,并依序输出到文件系统,同时公开了基于该算法的图像压缩装置和终端设备。本发明通过优化数据结构和压缩流程,能够显著提高深度图像的压缩和解压速度,同时保证压缩后深度图像的质量。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种兼容Zdepth的并行化深度图像压缩算法、装置及终端设备。
背景技术
近年来,随着虚拟现实(VR)、增强现实(AR)和3D建模技术的快速发展,深度信息的采集与处理变得日益重要。深度图像,作为一种记录物体距离摄像机的距离信息的数据形式,广泛应用于上述领域,为物体的三维重建、场景理解和交互提供了重要信息。然而,深度图像数据量庞大,对存储和传输带宽提出了极高的要求。为此,高效的深度图像压缩算法显得尤为重要。
尽管现有许多深度图像压缩技术,包括改良的传统方法和专为深度信息设计的算法,但它们通常难以同时满足压缩效率和图像质量的需求。特别是在实时处理和传输深度图像时,现有技术面临压缩解压延迟和高计算资源消耗的问题,限制了其应用。此外,由于移动设备重视低功耗和高效能,其CPU的计算能力受限,使得现有压缩算法难以在这些设备上高效运行。这在尝试实时压缩深度图像时尤为明显,因为单一CPU无法满足实时性要求,从而影响应用性能和用户体验。
发明内容
本发明的目的在于提供一种兼容Zdepth的并行化深度图像压缩算法、装置及终端设备,通过优化数据结构和压缩流程,有效利用并行处理硬件的高并行度,能够显著提高深度图像的压缩和解压速度,同时保证压缩后深度图像的质量。
为实现上述目的,本发明一种兼容Zdepth的并行化深度图像压缩算法,包括以下步骤:
S1、采集深度图像:采用HEVC算法对原始视频流进行压缩并编码,利用深度相机采集深度图像并进行预处理;
S2、量化处理:对预处理后的深度图像进行量化,根据无符号整数之间不存在时序依赖关系设计核函数,并通过该核函数使深度图像量化部分并行执行;
S3、零压缩阶段:对量化后数据中的连续零值进行识别压缩,并通过核函数建立并行化零压缩阶段;
S4、预测分块压缩阶段:对零压缩后的数据分配特定显存资源并设置合适的线程配置,实现像素块内的统一处理并消除块间依赖,之后计算像素块地址、优化预测器选择和打包处理无效值,最终将处理后的数据从显存转移至主存,确保与串行算法相同的数据完整性;
S5、数据输出:通过ZSTD算法对数据进行压缩,并将压缩结果依序输出到文件系统。
作为本发明进一步的方案:所述核函数包括网格块、线程块和线程,网格块、线程块和线程的单位比列为4:1:1。
作为本发明进一步的方案:所述S3、零压缩阶段包括以下步骤:
针对深度图像中具有的大量零值点,将每八个无符号短整型按照是否为零压缩到8bit;
使用一个pre的全局变量来表示上一个短整型是否为零;
使用当前值与之前的值进行异或操作,在处理连续非零值的深度图像时,压缩后的二进制字符串可能具有大量连续的零值,从而提高后续的ZSTD算法的压缩比;
参照量化部分,分配核函数,每一个核函数直接将每八个无符号短整型压缩到8bit,从而建立并行化零压缩阶段。
作为本发明进一步的方案:所述S4、预测分块压缩阶段包括以下步骤:
通过Zdepth算法流程,每一个8×8块内部的处理逻辑完全相同,除了访问全局容器的逻辑外,块与块之间不存在时序依赖关系;
在并行分块压缩算法中,为算法分配三块显存,blocksGPU、zigIndexGPU以及zigzagsGPU;
对于每一个实际执行的核函数,其线程块的标识为iy,线程的标识为ix,根据这两个ID计算出当前线程处理的8×8块的首地址;
随后,对该像素块中的每一个像素进行处理,选择合适的预测器;
处理zigzagsGPU与zigIndexGPU内部存在较多的无效值,将这两组数据打包为一个整体,通过一次遍历同时获取索引与值两个数据,使并行规约算法处理这两组数据,得到大小均为M+N的新zigzagsGPU、zigIndexGPU数组;
其中,M和N分别表示按照串行模式处理的edges容器大小及surfaces容器的大小;
将新的zigzagsGPU、zigIndexGPU再次打包,根据zigIndexGPU值再次进行并行划分,使zigIndexGPU中值为1的索引对应的zigzagsGPU及zigIndexGPU中的相应元素置于左侧,值为2的部分置于右侧;
此时,在zigzagsGPU最左侧连续M个元素表示应该处于edges容器中的一系列元素,最右侧连续N个元素表示应该处于surfaces容器中的一系列元素,最后将这些连续的元素由显存拷贝到内存中的相应容器内,至此,通过并行分块压缩得到的edges容器以及surfaces容器与串行处理算法结果在大小和内容上完全一致。
作为本发明进一步的方案:所述S5、数据输出包括以下步骤:
将预测分块压缩阶段生成的surfaces容器和edges容器的每两个12bit的像素转化为三个8位像素,对奇数长度的容器用零填充;
最后将打包后的surfaces容器和edges容器及图像被分隔成的块、图像数据中的零值区域分别通过ZSTD算法压缩,并将压缩结果依序输出到文件系统。
为实现上述目的,本发明还提供一种图像压缩装置,包括:
量化模块,用于减少表示数据所需的位数来减小数据的大小,实现数据压缩;在图像压缩中,量化将连续的像素值映射到有限的离散级别,减少存储和传输数据所需的带宽;
零压缩模块,通过连续的零值会被压缩成一个计数值和零的表示,极大地减少数据表示的空间;
预测模块,分块预测通过利用视频和图像数据中的空间和时间冗余性,提高数据压缩的效率,同时提供一种灵活和高效处理数据的方法,以适应不同的内容特性和传输需求;
打包及压缩模块,用于将打包后的surfaces容器和edges容器及图像被分隔成的块、图像数据中的零值区域分别通过ZSTD算法压缩,并将压缩结果依序输出到文件系统。
为实现上述目的,本发明另一方面提供一种终端设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;所述处理器执行所述程序或指令时实现上述图像压缩算法。
与现有技术相比,本发明的有益效果如下:
通过采用HEVC算法对原始视频流进行压缩并编码,利用深度相机采集深度图像,使采集到的图像具有更高的像素;
通过设计核函数使深度图像量化部分并行执行,图像数据被简化为较小的比特标识,有效减少数据传输所需的带宽;
通过使用pre的全局变量来表示一个短整型是否为零,极大地减少了数据表示的空间,有效提高压缩效率、避免分支预测失败导致的性能问题;
通过在并行分块压缩算法中分配多块显存,以此提高数据压缩的效率,同时也提供了一种灵活和高效处理数据的方法,以适应不同的内容特性和传输需求。
附图说明
图1示出了本发明实施例提供的整体图像压缩方法流程示意图;
图2示出了本发明实施例提供的零压缩方法示意图;
图3示出了本发明实施例提供的预测分块压缩阶段处理示意图;
图4示出了本发明实施提供的图像压缩装置的结构示意图;
图5为本发明实施例的终端设备结构示意图。
图中:After xor 表示:后续组值;reverse every 8bit 表示:每8bit为一组;CPU Friendly表示:占用资源较小的CPU ;Nums[i]?1:0 表示:数组值0:1;GPU Friendly表示:占用资源较小的GPU ;Nums[16] 表示:16位数组值;
Parallel Remove empty memory表示:并行释放空内存;Parallel adjust data表示:并行数据处理。
具体实施方式
下面通过实施例对本发明作进一步说明。
如图1所示,一种兼容Zdepth的并行化深度图像压缩算法,包括以下步骤:
S1、采集深度图像:采用HEVC算法对原始视频流进行压缩并编码,编码格式为H265,利用深度相机采集深度图像并进行预处理,预处理包括对图像的去噪标准化等操作;
S2、量化处理:对预处理后的深度图像进行量化,根据无符号整数之间不存在时序依赖关系设计核函数,并通过该核函数使深度图像量化部分并行执行;
S3、零压缩阶段:对量化后数据中的连续零值进行识别压缩,并通过核函数建立并行化零压缩阶段;
S4、预测分块压缩阶段:对零压缩后的数据分配特定显存资源并设置合适的线程配置,实现像素块内的统一处理并消除块间依赖,之后计算像素块地址、优化预测器选择和打包处理无效值,最终将处理后的数据从显存转移至主存,确保与串行算法相同的数据完整性;
S5、数据输出:通过ZSTD算法对数据进行压缩,并将压缩结果依序输出到文件系统。
本实施例采用的深度相机,其有效距离为0.25到5.46米,在设定帧率(Frame PerSecond,FPS)为30的前提下,可见光传感器分辨率为3840×2160像素;深度传感器为30FPS,640×576像素或15FPS,1024×1024像素;并支持多台设备间的时序同步,所采集的深度图位深为16bit,并以大端模式存储在内存中或持久化到硬盘中。
针对深度相机因捕获深度信息的精度随距离的增加而降低的特点,结合深度相机本身的工作范围,如下式:
式中x表示深度相机捕获深度信息时用来衡量对象与相机之间的距离,采用分段压缩方法,分别将自550毫米、925毫米、1300毫米及1675毫米起的表示范围扩大了2倍、4倍、8倍及16倍;使有16位的无符号整数表示的距离[0,65535],压缩到[0,11840],在内存中可以用12位无符号整数表示;
为了使核函数达到处理效果,进一步的,所述核函数包括网格块、线程块和线程,网格块、线程块和线程的单位比列为4:1:1,本实施例中根据每一个16位无符号整数之间不存在时序依赖关系,设计一个网格块为16,线程块为height/4,线程为width/4的CUDA核函数,从而使量化部分能够并行执行。
进一步的,所述S3、零压缩阶段包括以下步骤:
针对深度图像中具有的大量零值点,为了提高压缩效率,将每八个无符号短整型按照是否为零压缩到8bit;直观的方法是按照该字节的第X位表示每八个无符号短整型的第X无符号短整型是否为零,如图2所示;
此外,为了避免分支预测失败导致的性能问题,以及便于程序流水线运行,使用一个pre的全局变量来表示上一个短整型是否为零;
使用后续组值与之前的值进行异或操作,图2中第一行所示即为之前的值,第二行为后续组值,第三行所示为异或操作结果;在处理连续非零值的深度图像时,压缩后的二进制字符串可能具有大量连续的零值,如图2右侧部分CPU Friendly标识的一串二进制字符串,较具有GPU Friendly标识的二进制字符串分布更连续,从而提高后续的ZSTD算法的压缩比;
针对上述操作会存在深度图的每一个像素都与该全局变量相关,导致像素之间出现时序性,最终丧失并行执行的能力的问题;参照量化部分,分配一个固定网格块、线程块、线程的核函数,每一个核函数直接将每八个无符号短整型压缩到8bit,从而建立并行化零压缩阶段。
进一步的,所述S4、预测分块压缩阶段包括以下步骤:
通过Zdepth算法流程,每一个8×8块内部的处理逻辑完全相同,除了访问全局容器的逻辑外,块与块之间不存在时序依赖关系;
对此,设计了对应的适用于并行执行的并行分块压缩算法,在并行分块压缩算法中,对算法分配三块显存,blocksGPU、zigIndexGPU以及zigzagsGPU;
其中blocksGPU存储每个压缩块使用的预测器的ID,数据类型为无符号单字节整型;在图像上的含义为非最上方或最左侧的压缩块;
zigIndexGPU及zigzagsGPU的类型分别为无符号单字节整型和无符号短整型,在zigIndexGPU数组中,对于索引i,若值为0表示zigzagsGPU在i处不存在有效数据;若值为1,则表示zigzagsGPU数组在i处的zigzag值应放入edges容器;若值为2,则表示zigzagsGPU数组在i处的值应放入surfaces容器;
此外,原始深度图像虽然具有高宽两个维度,但是在显存中被展平为一维数组,其首地址为depth;
对于每一个实际执行的核函数,其线程块的标识为iy,线程的标识为ix,根据这两个ID计算出当前线程处理的8×8块的首地址;
随后,对于该像素块中的每一个像素进行处理,选择合适的预测器,并根据像素值将预测结果分别用1与2进行标记;在核函数中x与y变量为相对于该块的横坐标及纵坐标,它们的范围均为0到8;
针对zigIndexGPU及ZigzagsGPU可能会被多张图片使用,在每一次使用前,需要将这两块显存中的所有数据置为零,从而避免产生歧义,从而错误扩大edges与surfaces的大小;
当前核函数执行完成后,需要等待所有核函数执行完毕,才能够得到完整的zigzagsGPU、zigIndexGPU以及blocksGPU;但zigzagsGPU与zigIndexGPU内部存在较多的无效值,需要在保证这两块显存内部元素相对有序的前提下,删除在zigIndexGPU中值为0的索引对应的zigzagsGPU及zigIndexGPU中的相应元素,详细方法如图3示;处理zigzagsGPU与zigIndexGPU内部存在较多的无效值,将这两组数据打包为一个整体,通过一次遍历同时获取索引与值两个数据,使并行规约算法处理这两组数据,得到大小均为M+N的新zigzagsGPU、zigIndexGPU数组;
其中,M和N分别表示按照串行模式处理的edges容器大小及surfaces容器的大小;
将新的zigzagsGPU、zigIndexGPU再次打包,根据zigIndexGPU值再次进行并行划分,使zigIndexGPU中值为1的索引对应的zigzagsGPU及zigIndexGPU中的相应元素置于左侧,值为2的部分置于右侧;
此时,在zigzagsGPU最左侧连续M个元素表示应该处于edges容器中的一系列元素,最右侧连续N个元素表示应该处于surfaces容器中的一系列元素,最后将这些连续的元素由显存拷贝到内存中的相应容器内,至此,通过并行分块压缩得到的edges容器以及surfaces容器与串行处理算法结果在大小和内容上完全一致。
进一步的,所述S5、数据输出包括以下步骤:
在量化过程中,深度图像的每一像素的上限由16bit转化为12bit,但是在内存中仍占据2字节,因此将分块压缩阶段生成的surfaces容器和edges容器的每两个12bit的像素转化为三个8位像素,对奇数长度的容器用零填充,从而实际降低各容器所占内存;
最后将打包后的surfaces容器和edges容器及图像被分隔成的块、图像数据中的零值区域分别通过ZSTD算法压缩,并将压缩结果依序输出到文件系统。
如图4所示,一种图像压缩装置,包括:
量化模块,用于减少表示数据所需的位数来减小数据的大小,实现数据压缩;在图像压缩中,量化将连续的像素值映射到有限的离散级别,减少存储和传输数据所需的带宽;
零压缩模块,通过连续的零值会被压缩成一个计数值和零的表示,极大地减少数据表示的空间;
预测模块,分块预测通过利用视频和图像数据中的空间和时间冗余性,提高数据压缩的效率,同时提供一种灵活和高效处理数据的方法,以适应不同的内容特性和传输需求;
打包及压缩模块,用于将打包后的surfaces和edges数组及blocks,zeros分别通过ZSTD算法压缩,并将压缩结果依序输出到文件系统。
如图5所示,一种终端设备,包括:
处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,处理器包括一个或一个以上处理核心,处理器通过总线与存储器相连;处理器执行程序或指令时实现上述图像压缩算法。
存储器可以由任何类型的易失性或非易失性存储设备或者组合实现,如静态随时存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
此外,本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的兼容Zdepth的并行化深度图像压缩算法的步骤。可选的,本发明还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面兼容Zdepth的并行化深度图像压缩算法的步骤。
本领域普通技术人员可以理解,实现上述实施例的全部或部分步骤的过程可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
Claims (7)
1.一种兼容Zdepth的并行化深度图像压缩算法,其特征在于,包括以下步骤:
S1、采集深度图像:采用HEVC算法对原始视频流进行压缩并编码,利用深度相机采集深度图像并进行预处理;
S2、量化处理:对预处理后的深度图像进行量化,根据无符号整数之间不存在时序依赖关系设计核函数,并通过该核函数使深度图像量化部分并行执行;
S3、零压缩阶段:对量化后数据中的连续零值进行识别压缩,并通过核函数建立并行化零压缩阶段;
S4、预测分块压缩阶段:对零压缩后的数据分配特定显存资源并设置合适的线程配置,实现像素块内的统一处理并消除块间依赖,之后计算像素块地址、优化预测器选择和打包处理无效值,最终将处理后的数据从显存转移至主存,确保与串行算法相同的数据完整性;
S5、数据输出:通过ZSTD算法对数据进行压缩,并将压缩结果依序输出到文件系统。
2.根据权利要求1所述的一种兼容Zdepth的并行化深度图像压缩算法,其特征在于,所述核函数包括网格块、线程块和线程,网格块、线程块和线程的单位比列为4:1:1。
3.根据权利要求1或2所述的一种兼容Zdepth的并行化深度图像压缩算法,其特征在于,所述S3、零压缩阶段包括以下步骤:
针对深度图像中具有的大量零值点,将每八个无符号短整型按照是否为零压缩到8bit;
使用一个pre的全局变量来表示上一个短整型是否为零;
使用后续组值与之前的值进行异或操作,在处理连续非零值的深度图像时,压缩后的二进制字符串可能具有大量连续的零值,从而提高后续的ZSTD算法的压缩比;
参照量化部分,分配核函数,每一个核函数直接将每八个无符号短整型压缩到8bit,从而建立并行化零压缩阶段。
4.根据权利要求1或2所述的一种兼容Zdepth的并行化深度图像压缩算法,其特征在于,所述S4、预测分块压缩阶段包括以下步骤:
通过Zdepth算法流程,每一个8×8块内部的处理逻辑完全相同,除了访问全局容器的逻辑外,块与块之间不存在时序依赖关系;
在并行分块压缩算法中,为算法分配三块显存,blocksGPU、zigIndexGPU以及zigzagsGPU;
对于每一个实际执行的核函数,其线程块的标识为iy,线程的标识为ix,根据这两个ID计算出当前线程处理的8×8块的首地址;
随后,对于该像素块中的每一个像素进行处理,选择合适的预测器;
处理zigzagsGPU与zigIndexGPU内部存在较多的无效值,将这两组数据打包为一个整体,通过一次遍历同时获取索引与值两个数据,使并行规约算法处理这两组数据,得到大小均为M+N的新zigzagsGPU、zigIndexGPU数组;
其中,M和N分别表示按照串行模式处理的edges容器大小及surfaces容器的大小;
将新的zigzagsGPU、zigIndexGPU再次打包,根据zigIndexGPU值再次进行并行划分,使zigIndexGPU中值为1的索引对应的zigzagsGPU及zigIndexGPU中的相应元素置于左侧,值为2的部分置于右侧;
此时,在zigzagsGPU最左侧连续M个元素表示应该处于edges容器中的一系列元素,最右侧连续N个元素表示应该处于surfaces容器中的一系列元素,最后将这些连续的元素由显存拷贝到内存中的相应容器内,至此,通过并行分块压缩得到的edges容器以及surfaces容器与串行处理算法结果在大小和内容上完全一致。
5.根据权利要求4所述的一种兼容Zdepth的并行化深度图像压缩算法,其特征在于,所述S5、数据输出包括以下步骤:
将预测分块压缩阶段生成的surfaces容器和edges容器的每两个12bit的像素转化为三个8位像素,对奇数长度的容器用零填充;
最后将打包后的surfaces容器和edges容器及图像被分隔成的块、图像数据中的零值区域分别通过ZSTD算法压缩,并将压缩结果依序输出到文件系统。
6.一种图像压缩装置,其特征在于,包括:
量化模块,用于减少表示数据所需的位数来减小数据的大小,实现数据压缩;在图像压缩中,量化将连续的像素值映射到有限的离散级别,减少存储和传输数据所需的带宽;
零压缩模块,通过连续的零值会被压缩成一个计数值和零的表示,极大地减少数据表示的空间;
预测模块,分块预测通过利用视频和图像数据中的空间和时间冗余性,提高数据压缩的效率,同时提供一种灵活和高效处理数据的方法,以适应不同的内容特性和传输需求;
打包及压缩模块,用于将打包后的surfaces容器和edges容器及图像被分隔成的块、图像数据中的零值区域分别通过ZSTD算法压缩,并将压缩结果依序输出到文件系统。
7.一种终端设备,其特征在于,包括:
处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;所述处理器执行所述程序或指令时实现如权利要求1-5任一项所述的图像压缩算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410412342.8A CN118037870B (zh) | 2024-04-08 | 2024-04-08 | 一种兼容Zdepth的并行化深度图像压缩算法、装置及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410412342.8A CN118037870B (zh) | 2024-04-08 | 2024-04-08 | 一种兼容Zdepth的并行化深度图像压缩算法、装置及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118037870A CN118037870A (zh) | 2024-05-14 |
CN118037870B true CN118037870B (zh) | 2024-06-07 |
Family
ID=90989393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410412342.8A Active CN118037870B (zh) | 2024-04-08 | 2024-04-08 | 一种兼容Zdepth的并行化深度图像压缩算法、装置及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118037870B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104125466A (zh) * | 2014-07-10 | 2014-10-29 | 中山大学 | 一种基于gpu的hevc并行解码方法 |
CN115641264A (zh) * | 2022-11-07 | 2023-01-24 | 浙江智马达智能科技有限公司 | 一种基于cuda的图像预处理方法及图像预处理系统 |
CN116664705A (zh) * | 2023-03-29 | 2023-08-29 | 中国科学院高能物理研究所 | 一种面向智能无损压缩算法的异构计算加速方法 |
CN116847095A (zh) * | 2022-03-23 | 2023-10-03 | 华为技术有限公司 | 一种图像压缩方法,图像解压方法和图像处理装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11153550B2 (en) * | 2018-04-06 | 2021-10-19 | Disney Enterprises, Inc. | Depth codec for real-time, high-quality light field reconstruction |
US12021550B2 (en) * | 2020-12-11 | 2024-06-25 | Intel Corporation | Compression engine with configurable search depths and window sizes |
-
2024
- 2024-04-08 CN CN202410412342.8A patent/CN118037870B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104125466A (zh) * | 2014-07-10 | 2014-10-29 | 中山大学 | 一种基于gpu的hevc并行解码方法 |
CN116847095A (zh) * | 2022-03-23 | 2023-10-03 | 华为技术有限公司 | 一种图像压缩方法,图像解压方法和图像处理装置 |
CN115641264A (zh) * | 2022-11-07 | 2023-01-24 | 浙江智马达智能科技有限公司 | 一种基于cuda的图像预处理方法及图像预处理系统 |
CN116664705A (zh) * | 2023-03-29 | 2023-08-29 | 中国科学院高能物理研究所 | 一种面向智能无损压缩算法的异构计算加速方法 |
Non-Patent Citations (1)
Title |
---|
基于GPGPU的JPEG2000图像压缩方法;李玉峰;吴蔚;王恺;崔迎炜;;电子器件;20130420(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN118037870A (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11044478B2 (en) | Compression with multi-level encoding | |
US11595630B2 (en) | Depth codec for real-time, high-quality light field reconstruction | |
JP7431742B2 (ja) | 三次元物体を表すポイントクラウドを符号化/復号する方法及び装置 | |
CN111402380B (zh) | 一种gpu压缩纹理处理方法 | |
US7065530B2 (en) | Data structure for efficient access to variable-size data objects | |
CA2062965C (en) | Method and apparatus for compression and decompression of digital data | |
JP2018198421A (ja) | 二次元ポイントクラウドを符号化および復号する方法および装置 | |
JP2018534881A (ja) | 点群を圧縮する方法 | |
CN105933708B (zh) | 一种数据压缩和解压缩的方法和装置 | |
RU2767771C1 (ru) | Способ и оборудование для кодирования/декодирования облака точек, представляющего трехмерный объект | |
US20220014767A1 (en) | Bit plane encoding of data arrays | |
US20180184096A1 (en) | Method and apparatus for encoding and decoding lists of pixels | |
EP4275354A1 (en) | Apparatus and method for point cloud processing | |
CN112184587B (zh) | 一种边缘数据增强模型、以及基于所述模型的高效边缘数据增强方法及系统 | |
US11263786B2 (en) | Decoding data arrays | |
CN115238345A (zh) | Bim模型处理方法、装置、存储介质及电子装置 | |
KR20230119694A (ko) | 온라인 시청을 위한 실시간 압축해제를 위해 볼류메트릭3차원 장면을 나타내는 데이터를 압축하기 위한 방법 및 디바이스 | |
CN116894457B (zh) | 深度学习模型的网络权重存取方法 | |
CN118037870B (zh) | 一种兼容Zdepth的并行化深度图像压缩算法、装置及终端设备 | |
CN105791819A (zh) | 一种图像的帧压缩方法、图像的解压缩方法及装置 | |
US11189006B2 (en) | Managing data for transportation | |
CN109710784B (zh) | 一种基于lerc的遥感影像数据空间快速可视化方法 | |
CN111510729A (zh) | 一种基于视频编解码技术的rgbd数据压缩传输方法 | |
CN115546328B (zh) | 图片映射方法、压缩方法、解码方法、电子设备 | |
WO2023113917A1 (en) | Hybrid framework for point cloud compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |